共同通信社 スポーツ報道写真のキャプションは音声で入力 アドバンスト・メディアの音声認識ソフトでテキスト変換して自動化

アドバンスト・メディアは、同社の音声認識ソフト「AmiVoice Ex7 Business(アミボイス イーエックスセブン ビジネス)」が、共同通信社のスポーツ報道写真のキャプション入力に採用されたことを発表した。ラグビーW杯や世界陸上等、スポーツ競技大会を中心に活用される。(上の画像は公式サイトより引用)


スポーツ報道写真のスピード配信と業務効率化に

共同通信社は1945年の創立以来、国内外のニュースを取材、編集して全国の新聞社、放送局、海外メディアに配信しており、これまで数多くの歴史的瞬間を報道写真として記録してきた。今回、スポーツ報道写真の更なるスピード配信と業務効率化を目的に、音声認識ソフト「AmiVoice Ex7 Business」を採用。

AmiVoice Ex7 Businessは、話した内容をそのままSFA・CRM等に入力できるスタンドアローン型のWindows向けソフトウェア。領域特化型の音声認識エンジンを使用する事で、コンシューマー向けの音声認識エンジンと比較し約2倍の速度で入力する事ができ、業務負担の軽減および情報の量と質の向上を両立する。一般ビジネス向けの他、製薬・金融・保険業界に特化した各エンジンが用意されている。

W杯や大きな国際競技では、1試合で500枚以上の写真を出稿、リアルタイムで加盟新聞社に配信しており、集中力とスピード感が求められる文字入力は肉体的な負荷が重く、課題となっていた。また担当デスクはテレビで実況を聞きながら作業する事が多く、音声をテキストに変換して欲しい、という要望が出ていたという。

これらの背景をもとに共同通信社のシステム担当者がテキスト変換ツールを精査した結果、音声認識ソフト「AmiVoice Ex7 Business」が導入された。音声認識技術によってカメラマンの声を自動で文字化し、その変換結果を元に写真内容の確認、選別、選手の特定、説明文の編集といった作業を効率的、かつスピーディに行うことができるようになったという。運用は2019年ラグビーW杯日本大会からスタート。

「AmiVoice Ex7 Business」では固有名詞や専門用語等の単語カスタマイズも可能

ラグビーW杯では、選手名やラグビー用語等をあらかじめ学習させた音声認識エンジンを使用する事で、例えば「ヴァルアサエリ愛」「アマナキ・レレイ・マフィ」といった変換が難しい日本代表選手名も正確に変換した。2020年の東京オリンピック・パラリンピックに向け、国内外で開催される競技大会は今後も増加が見込まれる。共同通信社では音声認識技術の更なる活用拡大を検討している。

今回の導入はアドバンスト・メディアとTooと共同で実施。アドバンスト・メディアは、幅広い業種・業態での更なる音声入力の普及を目指し、今後も積極的な製品開発やサービス提供に取り組んでいくとしている。

ABOUT THE AUTHOR / 

山田 航也

横浜出身の1998年生まれ。現在はロボットスタートでアルバイトをしながらプログラムを学んでいる。好きなロボットは、AnkiやCOZMO、Sotaなどのコミュニケーションロボット。

PR

連載・コラム