【世界初】12方向から話す人を聞き分ける「多指向性マイクロフォン用開発キット」集音と自動追従機能も搭載 NTTグループが開発

企業やそこで働く人々にとって、日常的に行われる会議の議事録作成は、大きな負担となっている。その手助けとなる自動議事録作成ツールは、多くの企業が開発し販売しているが、一般的な置き型全指向性マイクを使用し複数人の会話を収録すると、話者の識別が困難なため、音声の認識率に悪影響を及ぼし、また、一人ひとりにマイクを用意すると、装着の煩わしさやコストの増加などの問題が発生する。

これらの問題を解決すべく、NTTアドバンステクノロジ株式会社(NTT-AT)とNTTテクノクロス株式会社(NTT-TX)は、NTTメディアインテリジェンス研究所の技術を活用して開発した世界初となる多指向性小型マイクロフォンモジュール(Voice Compass Direction Module)とアプリケーションの開発に必要な開発者用マニュアルをセットにした「Voice Compass Developer Kit」を、2020年12月上旬から販売することを、同年11月11日に発表した。
同製品は、1台のマイクデバイスで最大12方向の高度な話者分離を実現するため、正確かつ手軽な自動議事録作成に大きく貢献できる。なお、11月12日(木)~13日(金)に池袋サンシャインシティ・文化会館で開催される「コールセンター/CRMデモ&コンファレンス2020 in 東京」にて、同Kitを出展予定だ。
(※冒頭の画像はマイクデバイス外観です)



「Voice Compass Developer Kit」の概要

同製品は、NTTメディアインテリジェンス研究所で研究開発されたIM-ASTER技術をベースにしたマイクデバイス(NTT-ATが商品開発)とIM-ASTERライブラリ(NTT-TXが提供)、および開発者用マニュアルをセットで提供する製品だ。多指向性小型マイクロフォンモジュールは、最大12方向の音を個別に分離して集音する機能および話者の方向を自動で推定し位置変化に合わせて集音する自動追従機能を有している。このことから、同機能を会議議事録システムに搭載することで、今まで困難であった話者を分離・識別した音声認識ができるようになり、議事録作成業務の効率化が可能となる。

【IM-ASTER】IM:Intelligent Microphone/ASTER:Anti-distortion Suppression of noise with mask-based TransfER function estimation



「Voice Compass Developer Kit」の主な特長


● IM-ASTER技術により、最大12方向を個別に分離して集音を可能とする多指向性小型マイクロフォンモジュール(12方向から集音するが、各方向の集音範囲は概ね60°程度となる。)
● 話者の方向を自動で推定し、位置変化に合わせて集音する自動追従機能
● 高品質な雑音抑圧機能
● 8個のMEMS(Micro Electro Mechanical Systems(微小電気機械システム)) マイクとIM-ASTER技術によるソフトウェア処理で指向性をより鋭く形成
● 約60gの軽量・小型のため持ち運びが簡単
● マイクデバイスはUSBバスパワー方式による給電
● 12方向分離を商用化した製品は世界初(2020年10月現在 NTT-AT調べ)

▼提供範囲
同製品では、マイクデバイスで集音した音声を、ソフトウェアで処理することにより音声分離を実現。ソフトウェアはライブラリ形態での提供となる。

製品名 Voice Compass Developer Kit
提供物 Voice Compass Direction Module(マイクデバイス+IM-ASERライブラリ)および開発者用マニュアル

【製品セットイメージ】※PC本体は同製品に付属しない。



▼マイクデバイス

マイク素子数 8個
周波数特性 60~7,000Hz
消費電流 150mA以下
電源 USBバスパワー(DC5V)
外形寸法 H14.5×Φ64.7㎜
質量 約61g(コード除く)
対応OS IM-ASTERライブラリの動作要件に準ずる
付属品 USB(A‐miniB)コード(約1m)

▼IM-ASTERライブラリ

提供形態 ・64bit Windows DLL形式ライブラリ(Windows)
・共有ライブラリ(*.so)形式ライブラリ(Linux)
機能 ・方向別音声分離(最大12方向、自動追従時は最大6方向、収音範囲は約60°)
・自動追従機能(最大±30°の範囲)
動作要件 【Windows用】CPU:Inter Core i5以上のCPU OS:Windows 10 64bit
【Ubunt用】CPU:Quad-Core Inter Atom E3845 1.91GHz以上 OS:Ubunt64bit
【ARM Linux用】CPU:Cortex-Aシリーズ1.4GHz以上、NEON命令利用可 OS:Linux OS(ARM 32bit)
開発者用マニュアル ・インターフェース仕様書
・サンプルプログラム
販売開始時期 2020年12月上旬
販売元 NTT-AT、NTT-TX
価格・販売 価格や販売に関する詳細は別途問い合わせ


コールセンター/CRM デモ&コンファレンス2020 in 東京
https://www.callcenter-japan.com/tokyo/
NTT-AT展示会出展内容
https://www.ntt-at.co.jp/eventseminar/event/2020/detail/e_20201112/

ABOUT THE AUTHOR / 

ロボスタ編集部

ロボスタ編集部では、ロボット業界の最新ニュースや最新レポートなどをお届けします。是非ご注目ください。

PR

連載・コラム