フェイスブックの人工知能は、Instagramの投稿とハッシュタグで賢くなる

このほどフェイスブックは、Instagramに投稿された35億枚の画像を活用した画像認識アルゴリズムの訓練を紹介した。わたしたちがタグ付けして投稿した画像によって訓練されたソフトウェアは、これまでになく高い精度をもち、さらに「転移学習」によって活用の場面を広げているという。一方、この実験からは既存のソフトウェアの限界も明らかになっている。
フェイスブックの人工知能は、Instagramの投稿とハッシュタグで賢くなる
PHOTO: GETTY IMAGES/WIRED JAPAN

Facebookのようなソーシャルネットワークでは、ユーザーと企業が互恵関係にある。しかし、その一部は影に覆われている。

メリットは、世間話や写真を無料で手軽に友だちや家族と共有できることだろう。フェイスブック側の経済的な恩恵もわかりやすい。しかし、フェイスブックがどのようにデータを利用しているのか、ユーザーがその全容を知る機会はない。

そんななか、データの活用法を垣間見るチャンスがあった。フェイスブックが5月2日に発表した人工知能AI)に関する史上最大規模の実験だ。ソーシャルライフが機械学習に対し、いかに価値あるデータを提供するかがわかる。

わたしたちのソーシャルライフはフェイスブックにとって、AI分野でグーグルやアマゾンといった巨大テック企業に対抗するためのリソースとなるのだ。

35億枚の画像を使った実験

フェイスブックの研究者たちは、Instagramに投稿された35億枚の写真と、ユーザーが付けた計17,000件のタグを使って画像分類アルゴリズムを訓練した。タグのおかげで、画像のラベル付けにかかる予定だった人件費を払わずに済んだという。

グーグルも2017年6月にアルゴリズム用の巨大なトレーニングセットを公開した。だが、Instagramに投稿された写真のキャッシュは、その10倍以上になる。

この大量の画像を使い、フェイスブックはあるソフトウェアテストで新記録を樹立した。「ImageNet」というテストで、ソフトウェアに画像を「猫」「クルマのタイヤ」「クリスマスの靴下」といった1,000のカテゴリーへと分類させるものだ。

Instagramの画像のうち10億枚を使って訓練したアルゴリズムは、このテストで正答率85.4パーセントを記録したという。これまでの最高記録は、グーグルが今年はじめに樹立した83.1パーセントだった。

「転移学習」による応用

現実世界の問題を解決するために使われる画像認識アルゴリズムはたいてい、始めから利用目的を絞って訓練されている。精度を上げるためだ。例えば、ImageNetは機械学習システムのポテンシャルを計るために使われている。

「転移学習(Transfer Learning)」という手法を使えば、フェイスブックはInstagramの画像で訓練したアルゴリズムを特定のタスクに対応するよう微調整できる。まず大規模なデータセットを使ってコンピューターヴィジョンに基礎的な“視覚”を与え、その後、さらに特定分野の小規模なデータセットを使ってタスク別の訓練を行うのだ。

ご想像のとおり、Instagramのハッシュタグは「#犬」や「#猫」、「#夕焼け」など特定の項目に偏っている。しかし、転移学習を使えば、AIをもっと現実的な問題への対策に活用できるというわけだ。

マーク・ザッカーバーグが議会で話したところによると、AIはフェイスブックから暴力的なコンテンツや過激なコンテンツを排除するのに使えるという。同社はすでに、画像や動画からヌードや暴力表現を探すのに画像認識アルゴリズムを使っている。

フェイスブックでコンピューターヴィジョン応用部門を率いるマノハール・パルリによれば、Instagramのデータで訓練された機械学習モデルは、いずれ幅広い問題の解決に役立つのだという。

「われわれの手元には、微調整によってフェイスブックのさまざまな課題に対応できる、万能なヴィジュアルモデルがあるのです」とパウリは言う。

例えば、ユーザーに昔の写真の閲覧を促すシステムを強化したり、目が不自由な人のために画像を言葉で説明したり、違法あるいは好ましくないコンテンツを特定したりといった活用方法だ。ただし、実験に自分のInstagramの写真を使われたくない場合、アカウントを非公開にすればデータセットから写真を外すことができる。

フェイスブックの強み

フェイスブックのプロジェクトからは、企業がAIで競争するためにコンピューターや電気料金といったコストがどれだけかかるかもうかがえる。

Instagramのデータで訓練されたコンピューターヴィジョンは、画像へのタグ付けを数秒で完了させるとパウリは言う。しかし、35億枚の画像を使った訓練アルゴリズムは、42のサーヴァー、336の高性能グラフィックプロセッサを3週間以上にわたって占領していた。

「3週間以上」と聞くと、長く感じるかもしれない。しかし実際のところ、この数字は豊富なリソースとトップ研究者たちを擁する企業がいかに素早く動けるか、そしてAI実験の規模がいかに拡大したかを示すのだとレザ・ザデーは言う。ザデーはコンピューターヴィジョンの開発を手がけるスタートアップ、Matroidの最高経営責任者(CEO)で、スタンフォード大学の助教授も務めている。

グーグルは2017年夏、3億枚の写真を使ってソフトウェアを訓練した。その実験は、フェイスブックよりもはるかに少数のグラフィックプロセッサしか使わなかったが、2カ月かかった。

機械学習用に設計された高性能チップ[日本語版記事]は手に入りやすくなっている。しかし、それだけ多くのデータや高い処理能力を手に入れられる企業は少ないのだ。

機械学習のトップ研究者を雇うコストの高さを考えると、実験を短期間で行えるほど生産性は高くなる。「企業が競争を繰り広げているなかで、これはかなり有利なことです」とザデーは話す。

この強みを維持したいという欲求と、Instagramの画像を使った実験の規模を考えると、グーグルなどに続いて[日本語版記事]、最近になってフェイスブックが独自の機械学習用チップ開発を計画しはじめたのも合点がいく。

ソフトウェアの再設計が必要な問題も

とはいえ、AI開発はデータやコンピューターだけでどうにかなるものではない。例えば、画像からオブジェクトを探し出すテストで、Instagramで訓練されたアルゴリズムの成績は伸び悩んだ。

ザデーはこれに驚いたという。この結果は、大規模なデータセットをフル活用できるよう、既存の機械学習ソフトウェアを再設計する必要があることを示唆するからだ。

パルリは、フェイスブックの実験の限界をよく理解している。画像認識アルゴリズムは目的を限定したタスクを行う能力には優れている。数十億枚の画像を使った訓練も有効だろう。しかし、機械はまだ世界を人間と同じように理解する能力を備えてはいない。

こうした能力を向上させるには、根本的に新しいアイデアが必要になる。パルリは言う。「ただやみくもに規模を拡大するだけでは、こうした問題は解決できません。新しい手法が必要なのです」


RELATED ARTICLES
article image
グーグルが毎年恒例の開発者カンファレンス「Google I/O」で、人々の生活をもっと便利になると謳うさまざまな新サーヴィスを発表した。だが冷静に考えてみてほしい。その便利さと引き換えにわたしたちは、個人の行動にまつわるあらゆるデータをグーグルに差し出しているのだ。

[ インスタグラム/Instagramに関する記事一覧 ]

TEXT BY TOM SIMONITE

TRANSLATION BY ASUKA KAWANABE