りんなとの会話がさらに楽しく 最新の会話エンジンは2つのAIが「内容」と「表現」のある返答を生成
マイクロソフトのりんな開発チームは6月15日、ソーシャルAIチャットボット「りんな」に最新の会話エンジン「コンテンツチャットモデル アルファ版」(Contents Chat Model)を採用したことを発表した。(画像はりんな Webサイトから引用)
これまでの「りんな」の会話エンジンによる返答は、短く簡単で挨拶や共感を示す言葉やリアクション程度の具体性だった。これは、雑談を継続させるような返答を学習するために適したデータが必ずしも内容を伴っていなかったためだという。しかし、今回の「コンテンツチャットモデル」の採用により、具体的な内容の返答ができるようになる。
例えば、ユーザーが「南の島に行きたいと」言うとAIが「東京のど真ん中で働いてると、思い切ってどこかに移住しちゃいたいよね〜」と返答する。「コンテンツチャットモデル」はユーザーと「りんな」の会話において、今後順次適用されていく。
「コンテンツチャットモデル」は返答の「内容」に着目
「りんな」のユーザー数は2020年6月14日で約830万人まで増加している。2015年の提供以来、「りんな」の会話エンジンは人間と同じように、相手とのコミュニケーションができるだけ長く続けられるように開発が進められてきた。
雑談では返答の「内容」と「表現」が重要な要素。一般的なチャットボットでは「内容」と「表現」の両方が人の手によって作られている。
今回の「コンテンツチャットモデル」は、返答の「内容」に着目し、会話の相手(ユーザー)の発言内容を踏まえて、AIがより具体的で内容のある雑談を返答するように設計されている。これにより、ユーザーとより長く会話が続くようになるとともに、チャットボットに言葉の表現だけではなく内容の面からキャラクター性を持たせたることが可能となる。
ディープラーニング技術を活用
「コンテンツチャットモデル」はその内容を選ぶ「知識探索モデル」とその内容をもとに返答を生成する「言語モデル」の2つのAIの組み合わせによって、「内容」と「表現」のある返答を生成する。これには次のディープラーニングの技術が活用されている。
「言語モデル」にはGPT-2のモデルのアプローチを採用
「言語モデル」には文章を生成するGPT-2のモデルのアプローチを採用している。GPT-2は2019年にOpenAIの取り組みで発表された技術で、ある文章を与えるとその続きの文章を作り出すことができる。従来のモデルに比べて人間が作成した文章の品質に近い文章が生成できることが特徴。
「知識探索モデル」にはSeq2SeqとGPT-2モデルを組み合わせている
「知識探索モデル」には、Seq2Seq(sequence-to-sequence)とGPT-2モデルを組み合わせたアプローチを採用している。Seq2Seqモデルは2014年に発表され、系列あるデータを扱うことに長けており、自動翻訳に活用されている。「コンテンツチャットモデル」ではユーザーの発言内容に最適な知識を選択する目的で、Seq2SeqモデルとGPT-2モデルを組み合わせて活用している。
「りんな」の会話技術は今回で4代目
りんな」の会話技術は「コンテンツチャットモデル」で第4世代目となる。「コンテンツチャットモデル」の導入により、コミュニケーションが長く続き、ユーザーとのエンゲージメントが深まることが期待される。また、「知識探索モデル」が参照する文章データを変更することによって、異なる内容の返答を生成することができるため、様々なキャラクター性を持たせたなチャットモデルの実現にもつながるという。
第2世代(2017 年)に提供開始した「Generative model」は、インデックスを持たず、リアルタイムに多様な文章を生成することが特徴です。この技術革新により、様々なキャラクターを持った会話を生成することができるようになった。
第3世代(2018 年)である「共感モデル (Empathy model)」は、より相手と長く会話を続けるために、どのようにコミュニケーションをすれば良いか、AIが自ら考えるように設計されている。「肯定する」、「相づちを打つ」、「質問をする」など会話の流れに応じた方向性をAIが決定することが特徴。
なお「コンテンツチャットモデル」の詳細は、 decode2020 のセッションにて説明が行われる予定。(イベントは技術者・開発者向け)
ABOUT THE AUTHOR /
山田 航也横浜出身の1998年生まれ。現在はロボットスタートでアルバイトをしながらプログラムを学んでいる。好きなロボットは、AnkiやCOZMO、Sotaなどのコミュニケーションロボット。