「怒り」「喜び」「平静」といった感情を音声からリアルタイムに可視化する技術「感情認識 SDK/API」の提供がはじめられた。
ロボットへの応用も視野に入れていると言う。
バックオフィス支援事業および、パナソニック社の保有する特許技術を用いて技術支援サービスを展開する株式会社スワローインキュベートは、パナソニック株式会社の特許を活用した「音声による感情認識技術」で 「怒り」「喜び」「平静」をリアルタイムに可視化する「感情認識 SDK/API」を開発し、 販売ならびに無料トライアル版の提供を開始した。
顔の表情・テキスト・会話等から人の感情を読み取る「感情認識着技術」は、音声認識技術などと併用してロボットへ搭載されるなど、音声による感情認識技術の実用化が進みはじめている。
https://feeling.pas-ta.io/
「なんてことだ!」は喜んでる? 怒っている?
音声による感情認識技術は、「言語解析型」と「音響解析型」とに大別されおり、言葉を音声認識させた結果から感情を分析する 「言語解析型」では、複数の感情を表す言葉や、固有名詞を多く含む場合などは感情の判定が困難だった。
「感情認識SDK/API」は音声・会話を元に感情を判定しているが、同社の技術により、同製品ではそれらの問題に左右されず、音声自体の持つ特徴量をベースとした「音響解析型」で最大70パーセント程度の認識率で感情を判定するため、 「言語解析型」だけでは判別しにくかったクレームや、音声認識しにくい怒声なども検知することが可能になった。
「音声による感情認識技術」の特徴
速い処理速度
省メモリで軽量に動作するエンジン仕様のため、組み込みSDKを活用すれば約300ミリ秒、 クラウドAPIを利用しても約500ミリ秒の速さで感情認識を可能にする、独自の判定方法を使用。
教師データ(参照するデータ)が不要
パナソニックの特許技術を活用することで、 音声そのものが持つ特徴量から感情を認識するアルゴリズムとなるため、教師データが不要。あらかじめデータを収集する必要なく、導入直後からパフォーマンスを出すことができる。
ラズベリーパイでも実行可能
音声自体の持つ特徴量を分析するシンプルな感情判定アルゴリズムのため、専用の高価な端末や、 大規模サーバー群を用意することなく、オフライン環境や低スペック端末、Linux環境でも利用できる。
音声認識エンジンとの組み合わせも可能
あらゆる端末で利用可能な 組み込みSDK方式での提供も行っているため、 音声認識エンジンと併せての利用や、顔・表情による感情認識技術と併用して使うことが可能。
利用方法
クラウドAPI方式と、あらゆる端末で利用可能な 組み込みSDK方式の2種類を提供するため、 用途に応じた音声通話による感情認識やロボットの感情認識など汎用性の高い利用が可能となる。
クラウドAPI方式
・クラウド上の感情判定APIを実行
・処理速度は約500ms程度
・シンクライアントな設計に
組み込みSDK方式
・SDKをオンプレサーバーや端末内に組み込む
・処理速度は約300ミリ秒程度
・メモリ/CPUに余裕のある端末で実現可能
パナソニックは、今回の同社の技術開発は、教師データ不要な軽量なエンジンとなるため汎用性が高く、様々なシーンで活用できる感情認識技術が世の中に送り出されることを期待しているとコメントしている。
株式会社スワローインキュベート