ソニー、NTTドコモ担当者が登壇 | ロボスタ主催、第8回AI音声アシスタント勉強会が行われました
今回で8回目となる、ロボットスタート主催のAI音声アシスタント勉強会が3月8日、渋谷のドコモR&Dサテライトスペースで開催されました。応募者多数だったため、会場スペースギリギリの100名まで増席しました。
今回の勉強会では、NTTドコモのSebastienを搭載したデバイスや、「Amazon Echo Spot」、「Amazon Echo Look」、「Xperia Hello!」、「LINE Clova Friends」、「Google Home」、「Apple HomePod」を展示しました。
AIスピーカーにおける感性価値とは?
ソニー株式会社の倉田宜典さんからは「AIスピーカーにおける感性価値とは? バーチャルアナウンサー沢村碧活用事例のご紹介」というテーマでお話をして頂きました。
倉田さんの自己紹介はバーチャルアナウンサーの沢村碧さんが担当しました。
初代「AIBO」や二足歩行ロボット「QRIO」の開発に関わり、現在はソニーの製品に搭載される音声対話技術開発企画などを担当しているという倉田さん。併せて、ソニーモバイルコミュニケーションズ株式会社 スマートプロダクト部門 エージェント企画開発室 室長も兼務し、Xperia Hello!担当でもあります。
ソニーでは、音声認識エンジンなどを内製化し、[入力→理解→判断→出力]までを一気に扱うことのできる「ソニーエージェントテクノロジー」を開発しました。
このソニーエージェントテクノロジープラットフォームに関連するプロダクトで、耳を塞がず周囲の音を聞きながらイヤホンの音も聴けるデュアルリスニングを実現した「Xperia Ear Duo」や、倉田さんが担当されているコミュニケーションロボット「Xperia Hello!」などがあります。これらはUI進化系の事例と言えます。
Androidアプリの「めざましマネージャー アスナ」もUI進化系の事例です。”俺の嫁”なキャラクターが毎日あなたの名前を読んで起こしてくれる上に、スマホに音声で指示を出すことができます。スマートスピーカーのように「7時に起こして」や「明日の東京の天気は」などで指示が行えるというものです。
めざましマネージャー
バーチャルアナウンサー沢村碧の紹介です。
アバターエージェントとしての沢村碧は、キャラクターデザインをアニメーターの足立慎吾さん、音声合成のベース音声を声優の寿美菜子さんが担当しました。
倉田さん曰く、音声合成のベースになる声に適した声質というのがあるそうです。今回の寿美菜子さんも適した声質だそうです。
会場ではキャラクター選定の裏話についてもお話を頂きました。
アバターエージェントサービス
沢村碧を使ったサービスがソニーと共同通信デジタルが提供する、情報提供番組を簡単に作成することができるアバターエージェントサービスです。
現在、サービスはプロの方が使うことが多く、間違い部分があればお客自身で修正するそうです。利用者が使えば使うほど、使いやすくなるといいます。
導入事例は以下の通り。
・JR東海 名古屋駅デジタルサイネージでの「愛知デスティネーションキャンペーン2018」PR
・ソニースクエア渋谷での展示物案内やお客様から預かったメッセージの読み上げ
・TBSラジオ AI共存ラジオ 好奇心家族レギュラー出演(天気予報読み上げ)
続けて、渋谷MODIのサイネージを使った実証実験での裏側をお話しいただきました。
ニュース原稿の選定、写真の選定など素材の選定を行い、読み上げ原稿の形にして入稿します。入稿原稿を音声合成エンジンで出力し、読み上げ品質の確認を行います。
ポイントは、文字で読むニュース原稿をそのまま音声合成用の読み上げ用原稿にすると、ちょっとした違和感が生じるという点です。この点、気をつけて調整を行う必要があるそうです。
続いてニュースの長さ確認、オープニング・エンディングトークの選定、しぐさ選定、番組動画生成を行い、番組動画の品質確認を行います。こちらが完了したら番組動画としてビデオ納品し、完了です。
入稿から納品まで1時間以内で作成することができます。別の導入事例では入稿から納品まで15分程度で行っているケースもあるそうです。
この実証実験は2016年に行われ、視聴者からのインターネット調査の結果、キャラクターによるキャラクター読み上げに肯定的な人は75%という結果が出ました。
この渋谷MODIの実証実験は、デジタルサイネージアワード2017の「技術・ハードウェア賞」を受賞しました。
他にも、地上波TVの静岡放送イブアイ静岡での情報提供コーナーの事例についてもお話しいただきました。
普及が進むスマートスピーカー
ロボットスタート株式会社で、スマートスピーカーエバンジェリストを務める西田寛輔からはスマートスピーカーを俯瞰した内容での講義。
ロボスタのスマートスピーカーカオスマップを使用して、スマートスピーカーがいかに普及が加速しているか、そしてどのようにスキルを開発するのかなどを紹介しました。
ドコモのAIエージェント基盤戦略
NTTドコモの秋永和計さんからは、ドコモのAIエージェント基盤戦略についてお話頂きました。
秋永さんの専門分野は分散処理、機械学習、統計、自然言語処理、データベースなど。現在はproject SEBASTIENのプロジェクトリード、AIエージェント基盤の開発責任者を務めています。
ドコモは、2012年3月1日から行っているしゃべってコンシェルに代表されるAIエージェントの取り組みを多数行ってきました。既に6年近くAIエージェントに取り組んでいます。
project SEBASTIENの目標は「あらゆるモノに対話型AIサービスを提供したい」ということ。
自然な対話により会話ができたり、コンテンツを提供したり、デバイスを操作したり。まるであらゆるモノが意思を持ち、対話ができるような新しい体験を提供することを目指しています。
ドコモのAIエージェントの利用イメージです。メインエージェントとエキスパートエージェントに分かれています。
メインエージェントは執事のような存在。執事が基本的な会話を行い、要望を聞きます。その要望を実際に行うのはエキスパートエージェントです。要望の種類に応じて、エキスパートエージェントは別のエキスパートエージェントに交代します。
エキスパートエージェントは、メインエージェントから呼び出してサービスを行う存在です。
NTTドコモのエキスパートエージェントの特長は以下の3つ。
誰でも簡単にエージェントが作れるように、開発者向けダッシュボードが用意されています。会場で秋永さん実演の動画を見ましたが、簡単なものであれば5分程度で作ることができます。
(2)キャラクター性を出せる
NTTドコモがフリー素材として用意している音声は50種類以上。思う限りのほとんどの年代・特徴を網羅しています。
(3)安心のセキュリティ
メインエージェントとエキスパートエージェントの情報交換は最低限なので、お互いの情報はしっかり守られます。
NTTドコモでは対話機能を活用したビジネスを一緒に取り組んでくれる方を募集しているとのこと。
例えば、以下のような企業で活用できそうです。
・業務の効率化、人員削減のために対話機能を活用したいと考えている企業
・対話そのものを新しい価値として提供したい企業
・既存対話サービスに自サービスの動線として音声対話でのサービス提供を考えている企業
・基盤を利用したい企業向けのサービスインテグレーター
・難しいことは分からないけど、面白いことをやりたい方
秋永さんからのお話は以上です。
NTTドコモが「音声会話技術」と「AIエージェント」をオープン化!(1) 音声機能をデバイスやサービスに組み込む「AIエージェント基盤」
NTTドコモが「音声会話技術」と「AIエージェント」をオープン化!(2) 「AIエージェント基盤」の自由度が高い理由
NTTドコモ公認のproject SEBASTIEN User Communityもオープンしています。project SEBASTIENの開発や導入で困ったときに活用できます。
勉強会の最後は、ピザとビールとスマートスピーカーを囲んで談笑。最後まで大いに盛り上がった勉強会でした。
雨の中お越しいただいた皆様、会場をご提供頂いたNTTドコモ様、ご登壇頂いた皆様、ありがとうございました。
ABOUT THE AUTHOR /
北構 武憲本業はコミュニケーションロボットやVUI(Voice User Interface)デバイスに関するコンサルティング。主にハッカソン・アイデアソンやロボットが導入された現場への取材を行います。コミュニケーションロボットやVUIデバイスなどがどのように社会に浸透していくかに注目しています。