「Kibit」の独自開発を手掛けた株式会社FRONTEOと、人工知能ロボット「Kibiro」を展開する株式会社FRONTEOコミュニケーションズは、「Kibiro」の音声処理ソフトウェアを刷新するべく、東芝デジタルソリューションズ株式会社と東京大学発のベンチャー企業であるフェアリーデバイセズ株式会社、各社の技術を採用した。
同ロボットは法人向けパッケージおよび一般向けでの販売を行っている。
■ 人工知能ロボットKibiro 法人様向け紹介
■ 人工知能ロボットKibiro 一般向け紹介
刷新内容
今回の音声処理の刷新は、インバウンド対応の重要性を見据えた多言語での対応と、利用者とのスムーズなコミュニケーションに不可欠となる、より精度の高い音声認識技術・音声合成技術の必要性の高まりを受けたものだ。
採用したサービスは、東芝デジタルソリューションズの「RECAIUS音声認識サービス」「RECAIUS音声合成ミドルウェア ToSpeakG3 日米中版」、フェアリーデバイセズの提供する「mimi」サービス音声切り出しライブラリとなっている。
音声認識
音声認識機能には、東芝デジタルソリューションズの「RECAIUS音声認識サービス」を採用。同サービスには、ディープラーニングを用いた高度な音声認識で、特に「話し言葉」の認識に強く、低コストで高精度化できるカスタマイズ性と、辞書のチューニングを少ない手間で実現できるという特長がある。これにより、日本語・英語・中国語の認識に対応。音声認識の精度も従来に比べて向上した。
また、音声認識のキーの1つである音声区間認識技術には、マイクで拾った音の中から、人が発話する音声をより正確に把握できるよう、フェアリーデバイセズが提供する「mimi」サービスの音声切り出しライブラリを採用した。
http://www.toshiba.co.jp/cl/pro/recaius/lineup/viewer.html
音声対話システムのためのテクノロジースタック「mimi」
http://www.fairydevices.jp/mimi.html
音声合成機能
テキストデータから流暢な音声を出力できる音声合成ミドルウェア(サーバや組込機器向け)で、良好な音質でありながら省メモリを実現した、東芝デジタルソリューションズの「RECAIUS音声合成ミドルウェア ToSpeakG3 日米中版」を採用。
東芝独自方式による高音質な音声合成技術による滑らかな発話が特長で、日本語に加え、英語、中国語が発話可能となった。
http://www.toshiba.co.jp/cl/pro/recaius/lineup/tospeak.html
今後の展開
FRONTEOコミュニケーションズによると、東芝デジタルソリューションズ、およびフェアリーデバイセズとパートナーシップを結び、今後もロボットなどのデバイスを始めとしたさまざまなデジタルコミュニケーションのソリューションでビジネスの拡大を図っていくとのことだ。
また引き続き、優れた先端技術を持つ企業との連携を進め、より価値のあるサービス提供に取り組んでいくとも述べている。