10フレーズ読むだけで「自分のオリジナル音声合成」が作れる! 東芝の「コエステーション」が超すごい
2017年11月9日〜10日にかけて、お台場のグランドニッコー東京 台場で「TOSHIBA OPEN INNOVATION FAIR 2017」が開催されました。これは、東芝グループのデジタル関連のソリューション展示会です。
展示会だけではなく、2日間で基調講演を含む30を超える講演も開催されていました。
展示会会場も「ユースケースゾーン」「テクノロジーゾーン」に分かれており、ユースケースゾーンでは「ものづくりIoT」「物流・流通IoT」「社会インフラIoT」「エネルギーIoT」「ビル・施設IoT」の5つ、テクノロジーゾーンは「INNOVATION」「デジタル」「インダストリアルIoTセキュリティ」「AI」「先進技術」「働き方改革」という6つのテーマで展示が行われていました。
短いフレーズで自分の「コエ」を作ることが出来る「コエステーション」
まず気になったのが「コエステーション」というプラットフォーム。
これはコミュニケーションAI「RECAIUS(リカイアス)」の音声合成技術を用いて、その人声の特徴を捉えてオリジナルの合成音声が作れるというサービスです。
通常のオリジナル音声合成を作る場合は、たくさんのフレーズを話す必要があるのですが、「コエステーション」では10フレーズ程指定の文章を読むことでオリジナル合成音声を作ることができるとのこと。つまり少ない特徴点からユーザーの声を作り出すことが出来るのです。超すごくないですか?
使用方法としては、「ロボットなどでメッセージが来たら、その人の声で読み上げる」なんていうことも出来たりするのです。それもごく短時間で声が作れるということは、簡単に色々な人の合成音声が作れるというわけです。
短いフレーズなので、特徴点が少なく自分の声とは違うなんてことがあったとしても、「コエステーション」ではフレーズを追加で読んでいくことで、自分の声に似てくるようになるとのこと。徐々に読むフレーズ数を増やすなんてことも出来たりするのは面白いですよね。自分の声を育ててみたいです!!
スマートスピーカー&ロボットも
AIコーナーの「コミュニケーションロボットへの音声活用事例」のコーナーでは、「Kibiro」「ApriPetit」と音声対話デバイスとして北米向けに発売を予定してるスマートスピーカー「TH-GW10」、台湾に本拠を置くiPhoneなどの組み立てをしている「Pegatron社」製のスマートスピーカーが展示されていました。
Pegatron社製のスマートスピーカーは、技適の問題で電源は入れられていなかったのですが、表面には目が表示されて表現ができるようになっていました。裏側にはプロジェクターも内蔵されているとのことで、ここまでくるともはやスマートスピーカー範疇を超えている感じがしました。
そして「TH-GW10」。既報の様に本体にはカメラが付いており、それにより話者を認識したり、バーコードを認識したりできるようになっています。聞いたところでは業務での用途を意識しているとのことでした。
なんとカメラ部分は回転させることで物理的に隠す事が出来ます。やっぱりこうするのがセキュリティ的にも一番安全だったりしますよね。これは各メーカーにも見習って欲しいところです。
遠くない少し先の未来の話
今回ご紹介したプロダクトは、明日からすぐに使えるというわけではありませんが、遠くない未来に普通に使えるようになるのは間違いないでしょう。楽しみに待ちたいですね!