ついにニューラルネットワークは、羊の群れをキリンに変えることができた

  • 14,501

  • author Melanie Ehrenkranz - Gizmodo US
  • [原文]
  • 岡本玄介
  • X
  • Facebook
  • LINE
  • はてな
  • クリップボードにコピー
  • ×
ついにニューラルネットワークは、羊の群れをキリンに変えることができた
Image: Sangwoo Mo, Minsu Cho, Jinwoo Shin

AI界の麒麟児あらわる。

今となっては機械学習を使用して、美人女優の顔をニコラス・ケイジに変換するなんてことは朝飯前です。そして韓国でも同じくディープ・ラーニングを使い、ズボンとスカート、瓶とカップ、を入れ替えたり、さらにはもっと複雑な羊の群れなどを、キリンにしてしまう技術を生み出しました。

作ったのは韓国の大学

この技術「InstaGan」を作ったのは、韓国の国立大KAIST。平昌五輪で壁に穴を開けて聖火リレーをつないだ、あのロボットを作った学校です。そして共同研究をしているのが同じく韓国の浦項工科大学です。

「InstaGan」は一度に複数の画像要素の形状を変化させるもので、基にしているのは「敵対的生成ネットワーク(GANs)」という教師なし学習で使用される人工知能アルゴリズムの一種。これが画像内のオブジェクトや境界を識別する機能など、インスタンス情報を処理します。彼らの論文には、「自分たちの知る限りで、複雑な画像を使ってこのような技術を開発したのは、私たちが最初だと考えている」と書いています。

結果を見てみよう

たとえば下の参考例では、パンツスタイルの女性が背景をそのままにスカート姿になっており、4匹ほどいる羊たちがキリンに変化しています。拡大すると女性の脚が少々ボヤけているので、パーフェクトな結果ではないものの……知らずに見たらそういうものだと思わされてしまいますね。

190108_giraffes2
Image: Sangwoo Mo, Minsu Cho, Jinwoo Shin

キリンのほうも背景が潰れず、ちゃんとキリン化しています。この手のAI技術の中では、かなりの高レベルらしいのですが……キリンの胴体に、細長く伸ばした羊の顔が埋まっているような気がしますね。ちなみに3枚ある画像の真ん中が、彼らが以前に開発した技術によるもの。それを踏まえると、右の画像は異次元の進歩とも言えるでしょう。

研究者達は、この技術を使えばいろいろと応用が利くと話しています。たとえば人々が買いたい衣服で、どっちを選べばいいのか画像で比較してみるとか、「ニューラル機械翻訳」でAIに文章のタイピング時に次の単語や文を予測提案させたり、映像の生成にも使えるかも? とのこと。

悪用禁止!

当然ながら、悪意を持って有名人の顔を交換させるディープ・フェイク画像や映像の制作も可能にしてしまいます。ですが今のところは、暮らしを便利にすることが目的で開発されているので大丈夫そう。羊がキリンにトランスフォームするだけでは、著名人や国家が被害を被ることはありません。今後この技術がどう発展していくのかは、推して知るべしってとこですかね。

Source: VentureBeat