東芝の「テレビ局向けAI顔認識システム」映像情報メディア学会の進歩開発賞を受賞 選挙速報での実績を評価
株式会社東芝(以下、東芝) 、東芝デジタルソリューションズ株式会社(以下 TDSL)、日本テレビ放送網株式会社(以下 日本テレビ)の共同研究により開発されたテレビ番組制作支援用「AI顔認識」システム、カオメタが、映像情報メディア学会の2019年度進歩開発賞(現場運用部門)を受賞した。
2019年7月に行われた日本テレビの参議院選挙の特番などで、カオメタが中継現場での負荷を軽減したことなどがおおいに評価されてのことだという。
東芝とTDSLは、今後もカオメタをはじめとする画像認識の強化を進め、リアルタイム認識機能を強化するだけでなく、過去映像の人物特定(メタデータ付与)機能などを充実させていくことを意気込んでいる。
※冒頭の画像は東芝デジタルソリューションズ社の公式ホームページより引用
東芝の顔認識AI「カオメタ」の強みとその効果とは
今回評価されたカオメタの特徴をあげてみよう
①認識率99.74%の正確性(0.26%のミスも、異なるカメラ映像へと切り替わった際に、認識する顔を見失ってしまったためとのこと)
②生放送や撮影しながらのチェックなどにも耐えうるスピード
③照明やカット変更などテレビにありがちな画像の変化への追従性
④画像1枚から顔辞書登録が可能で加齢や髪型の変化などにも追従する柔軟性
⑤スピードに加えてミスが許されない生報道の現場で磨かれた扱いやすいUI
などだ。
誤報が許されない報道現場においては顔認識の要望は高い。
従来は撮影された素材においてどのタイミングで誰が写っているのかに関しては、オペレーターが「顔写真の掲載された冊子」やWeb検索などで得た情報と照らし合わせてチェックするのが通例で、続々と情報が飛び込んでくる選挙速報時などは「チェック待ち」の間に放送を逃してしまう、ということも有った。
しかし、実際に運用された2019年の参院選では、カオメタを導入することで続々と飛び込んでくる当選速報、それにまつわるバンザイ映像に対して素早く人名情報を付加、人間のチェックと合わせることでミスなく素早く素材をチェックするという新しい体制を構築できた。
新体制の効果により、オンエア出来たバンザイ映像が倍増するという結果が得られたという。
また、即位礼正殿の儀のように、AIの学習用素材が少ない上に、一目では人物特定が困難な海外の要人が多く集まるケースでも、カオメタは効果を発揮した。
画像一枚から顔認識が可能なカオメタを使っていたことで「他局のカメラマンが、間違えて従者の方にフォーカスしてしまうようなシチュエーションでも、顔認識によるチェックを反映し、要人を撮影し続けることが出来た」という。
こうした高い性能を見せるカオメタ。その機能の核はもともと東芝で持っていた技術だが、報道現場、テレビ番組制作にマッチした機能は、現場の高い要求にあわせ、アジャイルに開発していったものだと言う。
今回の受賞は開発者、時には研究者も帯同してのミーティングを続け、顧客要望の実現にむけて食らいついていったことも大きな要因だろう。
今後のカオメタの開発の方向性については、スポーツ中継のように、録画した素材の中から試合中活躍した選手を拾い出して即タグ付けし、編集加工しやすくする処理、テレビ局が持つ膨大な過去素材に対するタグ付けなど、現状得意としているリアルタイム性が高い生放送への運用に加えて、様々な局面への活用に期待が持てる。
優れたAI技術と、現場に密着した開発体制から生まれるソリューションの進化はまだまだ止まりそうにない。