ドコモのAIエージェントAPIでスマートスピーカーを開発! ロボスタ勉強会が開催
2月18日(月)19時より、ドコモR&Dサテライトスペースにて、「ドコモのAIエージェントAPI勉強会 – codama編」が開催されました。本記事では、こちらのイベントの模様をレポートしていきます。
今回の勉強会は、「ドコモのAIエージェントAPI」と、ユカイ工学から発売された開発者向け音声対話開発キット「codama(こだま)」、そしてロボットスタートの「ロボスタトーク」を活用して、スマートスピーカーを作成していくというものです。
ドコモのAIエージェントAPIとは?
ドコモのAIエージェントAPIとは、スマートスピーカーやチャットシステムなどで利用することができる、AIエージェント作成の基盤となるシステムのこと。「メインエージェント」と呼ばれるオリジナルのAIエージェント(キャラクター)を作成して、一般に公開したり、「エキスパートエージェント」と呼ばれるアプリケーションを動作させることができます。
音声認識・自然言語処理・音声合成の3つをパッケージとして利用することができるのが特徴で、様々なデバイスで使えるようなSDKが提供されており、音声合成は53種類の声から選択できるのも特徴です。
現在は全て無償でトライアル環境として提供されており、今年の春頃に正式リリースを予定しています。
ロボットスタートが提供している、開発者応援プラットフォーム。メインエージェントの技術を使っているため、codama等のハードウェアに搭載可能なほか、ドコモの「AIエージェントAPI」で作成した、エキスパートエージェントと呼ばれるアプリケーションを動作させることができる。
codamaでオリジナルなウェイクワードが設定可能
ユカイ工学から発売された開発者向け音声対話開発キット「codama」は、アレイマイクを搭載し、ラズベリーパイに簡単に取り付けることができる開発キットです。
codamaを使うことで、個人の声の波形データを取得し、その人の声だけに反応するウェイクワードを簡単に設定することができます。また、ノイズ低減・音源方向の検知ができ、さらにスピーカーの音をキャンセルするノイズキャンセル機能もあるため、人の声をクリアにキャッチすることができます。スピーカーが再生しているときにも割り込みでウェイクワードを認識するバージインも可能です。
今回参加者のみなさまには事前にウェイクワードのサンプルを録音してきて頂きました。その事前に収録したデータを元にcodamaにウェイクワードを登録していくところからハンズオンがスタート。
事前にウェイクワードの録音を忘れてしまった方は、グローバルウェイクワードの「codama」を使用します。
マイクに自身で設定したウェイクワードもしくは「codama」と呼びかけて、ドコモのAIエージェントAPIを呼び出します。そして、その中からドコモのAIエージェントで作成したエキスパートエージェント「ロボスタトーク」を呼び出すのです。ロボスタトークは自身で対話シナリオを作成することができます。つまり「codama」「ドコモのAIエージェントAPI」「ロボスタトーク」を活用することで「自身で設定したウェイクワードで、自身で作った対話シナリオを呼び出す」ことができるようになるのです。
ハンズオンのおよそ1時間半の間に、これらそれぞれの設定方法を学ぶという濃い内容…。
予定時間を過ぎるほど内容の詰まったてんやわんやの勉強会でしたが、みなさんcodama経由でロボスタトークを呼び出すところまでなんとかたどり着いたようです。
勉強会のあとは大急ぎで懇親会。
みなさんお酒片手に楽しそうに情報交換をされていました。
会場ではcodamaの即売会も行なわれました。
ハッカソンは3月16日・17日の2日間
今回使った「ドコモのAIエージェントAPI」を活用したハッカソンが3月16日(土)・17日(日)の2日間開催されます。
勉強会でも学んだ「codama」やラズパイなどが貸し出され、VUIのアプリを競うハッカソン。豪華な景品も用意されているようなので、参加を検討してみてはいかがでしょうか。
また、2月27日(水)19時からは、「ドコモの AIエージェントAPI 勉強会 -unity編-」も開催されます。すでにいっぱいですが、抽選での参加となりますので、2月20日(水)までにお申し込みください!