【恐るべき音声認識】Chapitについて調べてみたよ!
何と、先日ロボットドットインフォさんが共同で発表した、「コミュニケーションロボット出荷台数・背板普及率」のデータが雑誌「PRESIDENT」(2015年11.2号/10月10日発売)に掲載したとのことで、親にまともな仕事(顔を白塗りする仕事だけじゃない)をしているということが分かって貰えそうで喜んでいます。
その記事の中でレイトロンさんの「Chapit(チャピット)」が取り上げられいたので、少し突っ込んで調べてみたいと思います。
実は、この「Chapit」ですが先日お届けした「CEATEC JAPAN2015」のレポートでも軽く取り上げています。
これが最新型の「Chapit」。詳しいスペックは分かりませんでしたが、高さは40〜50センチ。よくあるぬいぐるみ的な大きさです。その上モフモフでいい感じです!!
ちなみにこの写真は4代目ということで、結構長い歴史があるんです。
具体的に何が出来るのかと言うと、簡単な会話が出来る「コミュニケーション機能」、クイズや計算モード、暗記ゲームの「ブレイントレーニング機能」、生活リズムを構築する「タイムサポート機能」、声で赤外線リモコンの代わりをする「家電コントロール機能」などが搭載されています。
「CEATEC JAPAN2015」のブースでは初代から並んでいました。
ちなみに左下の「A◯BO」みたいなのが初代です。モフモフではなく、首などが稼働するようになっていました。(上が2代目、右下が3代目とのこと)
ただ、4代目は可動部はありません。お話を聞いたら、「可動部から壊れるしコストもかかるので一切外した」とのこと。確かに愛着持っているロボットが故障して修理ということで、自分の手元から離れるのはちょっと切ないですものね。
そして、金額も13万8,000円というロボットとしてはお求め安い金額となっています。
もう一つの特徴は、音声認識が高いということ。
普通、CEATEC JAPAN2015の様な展示会でロボットを使おうとすると周辺の雑音を拾ってしまって音声認識は難しいというような状況なので、それに代わる手段を用意するのが普通となっています。
が、「Chapit」の場合は普通に認識しました。2ブロック離れた大型ブースでイベントが始まっても、ちゃんと認識できるとのことで、それはスゴイ!!
その心臓部がこの組み込み型音声認識モジュール「Voice Magic」です。
何故、雑音が多いなかで音声が取れるのか?
簡単に説明すると普通は「声を文字に変換して認識させる」という手法を取っているのですが、「Voice Magic」は「声を音として認識させる」という手法を取っています。それによって認識率が上がるということ。
音さえ登録しておけば言葉の壁もありません。
『こんにちは』と言う「音」を認識したら日本語で『こんにちは』というフレーズ返し、『你好』と言う音を認識したら中国語で『你好』というフレーズを返す。これを1つのロボットでシームレスで出来るようになっています。
逆を返せば設定しているフレーズ以外は認識できないのです…。この辺りはシナリオで上手く誘導するすれば良いとは思います。
このVoice Magicですが「ロビ」に搭載されているということで、案外身近なところにあったんですね。
元々はこちらの音声技術が先にあったところに、お客様から要望があってロボットを作るようになったというレイトロンさん。本当に勉強になりました。
「Chapit」と「Voice Magic」注目です!!