NTTドコモが、世界最高峰のデータ分析の競技会「KDD CUP」において世界で第1位の称号を手にした。
KDDは、Knowledge Discovery and Data mining (Database)の略称で、毎年恒例になっているビッグデータをもとに統計・分析・予測等を競うコンペティション(競技大会)のこと。最近はディープラーニングなど、ニューラルネットワーク関連技術を駆使して競う実践的な大会として注目されている。そして今年開催された「KDD CUP 2019」には39か国以上、230の学術研究機関から2800以上の登録チームが参加した。
どのような課題のコンペティションなのか、NTTドコモのチームはどのような点が評価されたのか。そして、今回評価されたAI技術は、実際にどのようなユースケースで使われているのか。ロボスタではNTTドコモのAI技術を3回にわたって特集、単独インタビューを行った。今回はその第一回。
課題設定や課題解決力を競う部門で優勝
米国の学会KDDが開催した「KDD CUP 2019」は2019年8月4日(日)から2019年8月8日(木)にかけて行われたKDD2019の中で開催された。4つの部門に分かれていて、NTTドコモが優勝したのは、公開されたデータを活用して課題設定や課題解決力を競う部門「Regular Machine Learning Competition Track Task 2“Open research/application challenge”」だ。
編集部
KDD CUPに参加したきっかけとこれまでの成績を教えてください
落合氏
私たちはデータ分析チームなので、私たちの分析能力が世界規模で見るとどのくらいなのかを知ること、さらには自分たちのレベルアップをはかることを、主な参加目的としています。初めて参加したのは2016年で、その時は12チームのファイナリストに残ることができました。2018年は16位で残念ながらファイナルに残ることができませんでした。
編集部
そして今年はついに優勝することができましたね、その理由を教えてください
落合氏
昨年までは「与えられたビッグデータを解析して予測精度を競う」という内容の課題が主体だったのですが、今年は課題の種類が増えて、「データだけを与えられてそれを見て自分たちで問題を決めて解決する方法を提案する」というものが追加になりました。今回はその提案型の課題で優勝することができました。
「予測精度を競う」課題と「自ら解決するテーマを決めて取り組む」課題
中国を中心に展開している有名な地図アプリに「Baidu Maps」がある。「Baidu Maps」は検索ログを公開していて、ある人がA地点からB地点まで行く場合、どのような交通手段でどうやって行くかを示す複数のルート情報と、ユーザーが結果的にどのルートを選んだかの情報が、膨大に集積されている。
従来からある課題は、それらのビッグデータをAI技術で解析、あるユーザーがどの交通手段でどんなルートを選択するかを予測するのが「予測精度を競う」ものだ。人は一番早く到着できるルートを必ずしも選択するとは限らず、最も楽なルート、料金が安いルートなどさまざまな選択肢が欲しいと思うものです。さらに競技で評価されるのは最適な選択肢を提示することではない。
落合氏
この課題で難しいのは、ベストなルートと交通手段を提示することではなく、その人の属性や特性情報、どのような交通手段を好むのか、最終的にどこに行くのかなど、複合的な要素から「この人ならこれを選択するだろう」という予測結果の精度を競うところです。乗換ルートの情報だけでなく、ユーザの属性や今までの傾向が含まれるビッグデータが提供されます。
そして今回から新設された課題は、このビッグデータを用いて、自分たちが研究課題を自ら設定し、その解決を行うというものです。
編集部
どんな点が評価されたのでしょうか
落合氏
私たちは環境問題の解決に応用できないか、と考えました。移動時間はできるだけ変わらずに、環境汚染物質(CO2)排出量をなるべく減らす交通手段やルートを提案するようにしました。例えば、なるべくクルマではなく自転車や徒歩を使うとかです。中国などではバイクシェア(自転車)などが盛んなので、それらを利用するルートを提案しつつ、どれくらいCO2の削減につながるかというシミュレーション結果も提示しました。
優勝できた理由は公式には発表されていませんが、表彰式のコメントを聞いた限りでは、データ分析を環境問題の解決に絡めて提案した点が評価されたようです。
CO2を減らす移動手段を提案
NTTドコモのチームは、提供されたビッグデータから、まず中国で社会問題として深刻化している大気汚染に着目した。さらには、短距離ではバス・地下鉄の利用者が多く、一方でバイクシェアが急速に拡大している社会背景にも注目した。そこで、移動時間をできるだけ増加させずに、距離が比較的短い移動には自転車の利用を提案するなど、CO2排出量が少ない経路をすすめることで環境汚染物質(CO2)の削減を目指した。
例えば、ユーザが実際に選択した経路と比較して、CO2排出量の平均値が834.6gから757.6gに9.23%削減でき、さらに平均移動時間も52分30秒から47分17秒に9.96%削減できることを示した。また、世界保健機関(WHO)は運動強度である11.25METh/weekを推奨しているが、電車から自転車に交通手段を変えることでその13.6%をカバーすることができ、利用者の健康面においても有効性を示した。
すなわち、大気汚染の軽減、利用者の移動時間の短縮、健康促進の3つの効果を示したことが、大きな評価につながった。
現在はまだ、移動ルートの選択時に環境問題や健康管理まで考える人は少ないかもしれない。しかし、このような発想が評価されたことは素晴らしい。なお、ここでさらに重要なのは発想だけではコンペティションで優勝することはできないということ。評価を得るにはそれを支える技術があったはずだ。
既に実用化が始まっているAIデータ解析技術
「NTTドコモは普段から業務でAIによるデータ分析を実践しています」(落合氏)と語る。その技術が活きて、優勝につながった。
具体的には「AIタクシー」「自転車シェアリングサービス」「スマートフォンを使ったストレスや集中力推定」「従業員の健康増進をサポート」などでAIが活用されています。これらは次世代のロボット、自動運転、スマートシティ、働き方改革、環境問題解決など、様々な分野での応用が期待されている「AIデータ解析」において、とても重要になるキーテクノロジーのひとつ。
次回はそれぞれの技術がどのようなものか、今後どのように応用されていくかを詳しく解説したい。
第2回「【NTTドコモのAI予測技術 (2/3)】AIタクシーとドコモ・バイクシェア リアルタイム版人口分布統計で数時間後の交通需要を予測」
ABOUT THE AUTHOR /
神崎 洋治神崎洋治(こうざきようじ) TRISEC International,Inc.代表 「Pepperの衝撃! パーソナルロボットが変える社会とビジネス」(日経BP社)や「人工知能がよ~くわかる本」(秀和システム)の著者。 デジタルカメラ、ロボット、AI、インターネット、セキュリティなどに詳しいテクニカルライター兼コンサルタント。教員免許所有。PC周辺機器メーカーで商品企画、広告、販促、イベント等の責任者を担当。インターネット黎明期に独立してシリコンバレーに渡米。アスキー特派員として海外のベンチャー企業や新製品、各種イベントを取材。日経パソコンや日経ベストPC、月刊アスキー等で連載を執筆したほか、新聞等にも数多く寄稿。IT関連の著書多数(アマゾンの著者ページ)。