話しかけた多言語を自動で識別して応対!下北沢の駅案内ロボットが自動言語識別機能を追加して「新宿駅」へ  オムロンとフェアリー

フェアリーデバイセズは、8月27日まで井の頭線 下北沢駅で試験運用していた駅案内ロボットに、新たに「自動言語識別機能」を搭載し、日本語・英語・中国語・韓国語での実証実験を行うことを発表した。駅案内ロボットは、オムロングループのオムロン ソーシアルソリューションズ株式会社が2019年3月16日から8月27日まで京王電鉄の井の頭線 下北沢駅で試験運用していたもの。従来は、駅総合案内のみ4言語に対応していた。新たな追加機能の搭載に合わせて、駅案内ロボットは京王線 新宿駅に移設する。実証実験は、9月18日から。


利用者の約3割が外国語で利用

フェアリーデバイセズは、駅案内ロボットに騒音環境下でも正確に音声を収集し、適切に聞き取ることができる音声処理技術を提供している。京王電鉄 井の頭線下北沢駅で実施していた実証実験では、日本語、英語、中国語、韓国語の4か国語での案内に対応し、そのうち利用者の約3割が外国語で使用していたという。

「自動言語識別機能」は、ユーザーが画面上で使用言語を選択することなく、話しかけてた言語を自動で識別することが可能。この機能は、国立研究開発法人情報通信研究機構(NICT)が開発したもので、技術的には対応言語は日、英、中、韓、タイ、ミャンマー、ベトナム、インドネシアの8言語に対応できるが、今回の試験運用では4言語(日、英、中、韓)となる。

従来の言語識別方式では10秒程度の長い発話でないと言語の識別は困難だった。しかし、大規模ネットワークを教師モデルとして、小規模ネットワーク(生徒モデル)が教師モデルと同じ結果になるよう学習させることで、高速かつ高精度の結果を得ることが可能になった。この知識蒸留学習により、「短い発話でも識別精度が高く、かつリアルタイムで識別可能な小規模ニューラルネット」を作成することで、1.5秒程度の音声での識別率9割以上を実現している。


mimi powered by NICTとは

国立研究開発法人情報通信研究機構(NICT)にて研究開発された音声認識・翻訳・音声合成機能を知的財産の実施許諾契約に基づき、当社の音声認識クラウドサービス「mimi cloud API service」にて提供しているもの。日英中韓(の各言語)に加え、技術的にはスペイン語、フランス語、ミャンマー語、インドネシア語、タイ語、ベトナム語の計10ヶ国語に対応しており、主要な訪日外国人客の使用言語を広範囲にカバーすることができる。



フェアリー社ではこの多言語音声翻訳エンジンを活用し、ホワイトラベル・アプリケーションとして、「mimi 音声翻訳 powered by NICT」を提供している。
導入企業は同社との個別契約に基づき、特定の商用利用向けにカスタマイズして提供することができるだけでなく、音声翻訳アプリケーションを保守運用する手間から解放され、より簡便かつ迅速に音声翻訳技術を業務の中に取り入れていくことが可能となる。



ABOUT THE AUTHOR / 

山田 航也

横浜出身の1998年生まれ。現在はロボットスタートでアルバイトをしながらプログラムを学んでいる。好きなロボットは、AnkiやCOZMO、Sotaなどのコミュニケーションロボット。

PR

連載・コラム