日本アンドロイドの会で披露された「自作AIスピーカーの作り方」

2018年1月26日にKDDIで日本アンドロイドの会月例会が開催されました。

今回のテーマは「ボイスアシスタントアプリ開発の今」。その中で、自作AIスピーカーを作ろうというセッションがありました。

発表されたがりっち(@garicchi)さんは静岡大学で対話システムを専門とする修士2年生の学生さん。

LINE、Google、Amazonから市販品のスマートスピーカーが販売されているのに、どうして自作する必要があるのかとお思いになる方もいるかもしれません。

自分で作ってみると無限大にカスタマイズが出来、圧倒的オリジナリティ溢れるスピーカーが作ることが出来るというメリットがあります。マイスマートスピーカーです。また自作することで、スマートスピーカーに対する理解も深まりますので、勉強したい方にもおすすめです。



どうやって作るのか

こちらのスライドを読みながらトライしてみましょう。



自作するためには、ハードウェアとソフトウェアの理解が必要です。

ハードウェアは、Raspberry PiとUSBマイクとUBSスピーカーを準備しましょう。



ソフトウェアは以下それぞれについて理解する必要があります。

 ・ホットワード検出:システムが正しいタイミングで反応する
 ・音声録音&認識:ユーザーの音声を文字に変換する
 ・発話理解:発話を正しく理解する
 ・対話モデル:何を言ったら何を返すかを決める
 ・音声合成:システムの発話を音声に変換する

この順番はスマートスピーカーを操作するときの処理の流れでもあります。スライド内では各項目でのおすすめソフトウェアを紹介していて、読むだけで勉強になります。

また、がりっちさんはRaspberry Piで簡単に自作スマートスピーカーを作ることができるOSSもつくりました

主にMicrosoft Cognitive Serviceを使用し、資料内容の機能の全てを網羅したもので、YouTubeにあるMusic Videoを再生する機能と赤外線送受信機能を搭載しています。

自分でスマートスピーカーを作ってみたい方は、是非資料を参考にトライしてみて下さい。自作派ではない方も、資料を読むだけでスマートスピーカーの構造がつかめて勉強になりますので、スライドを一読することをおすすめします。

こちらのスライドでは1から作っていますが、Alexa Voice ServiceGoogle Assistant SDKを使うとAlexaやGoogleAssistantの使えるスマートスピーカーもつくることができます。こちらにトライしてみる方は、以下関連記事をご覧ください。

ABOUT THE AUTHOR / 

北構 武憲

本業はコミュニケーションロボットやVUI(Voice User Interface)デバイスに関するコンサルティング。主にハッカソン・アイデアソンやロボットが導入された現場への取材を行います。コミュニケーションロボットやVUIデバイスなどがどのように社会に浸透していくかに注目しています。

PR

連載・コラム