「この強いAIは何だ?」オンライン麻雀の“謎”の答えは、マイクロソフト ──「不完全情報ゲーム」に強いAIは金融業界を変えるか

suphx-1

「あの強いAIはいったいどこがから来たの?」

日本国内有数のオンライン麻雀サービス「天鳳」のプレイヤー間で3月頃から話題になっていた“謎”の答えはマイクロソフトだった。

8月29日、マイクロソフトは、同社の研究開発部門であるMicrosoft Research Asiaが開発したAI「Microsoft Suphx(スーパー・フェニックス)」が、人間とともに日本の麻雀サービス「天鳳」でプレイし、トッププレイヤーランクのひとつである「十段」に初めて到達した、と発表した。

suphx-6

マイクロソフトの開発した麻雀AI「Microsoft Suphx(スーパー・フェニックス)」が、麻雀サービス「天鳳」のトッププレイヤーランクである「十段」に到達。

出典:マイクロソフト

suphx-4

「天鳳」でプレイ中のSuphx(手前のプレイヤー)。他のプレイヤーはみな人間だ。

出典:マイクロソフト

「十段」への到達が意味するのは、人間で最強レベルの麻雀プレイヤーに匹敵する能力を備えたAIができた、ということだ。天鳳は33万人のプレイヤーがいるサービスだが、「十段」に到達したのはそのうち180人しかいない。これは全プレイヤーのうち、上位0.0054%にあたり、プロ級といっていい腕前だ。

麻雀サービスで勝ち続ける「謎のAI」の正体が判明

shutterstock_177389552

Shutterstock

「天鳳」は、日本国内有数のオンライン麻雀サービス。前述のように世界中で33万人のプレイヤーがいる。実はこのサービス、運営側とAI開発企業が協力態勢をとっていて、開発中の強力なAIが、一般の人々と共に一緒に麻雀をプレイしている。プレイヤーも相手が人間なのかAIなのかは知った上で、対戦を楽しんでいるわけだ。

そんな天鳳の中でも、勝率の高い上級プレイヤーが集まる「特上卓」に、「@Suphx」というAIが現れたのは今年3月のこと。開発元の表記はない。

天鳳にはすでに、元東京大学の水上直紀氏がAI関連企業・HEROZで開発している「爆打」という麻雀AIと、ドワンゴが開発している「NAGA25」が参戦している。その中で、新参者であるSuphxはプレイを続けた。3カ月、5000局以上に及ぶ対戦を人や他のAIと繰り返し、勝率を上げていく。

「自分より強いのではないか」

「人間と違って弱気にならない」

「人間の手を分析するのでなくSuphxを参考にプレイする」

プレイヤーの間でも、Suphxの強さの認知は急速に進んだ。

suphx-7

十段に到達したSuphxを人間のトッププレイヤーも高く評価している。

出典:マイクロソフト

そして6月、Suphxは、特上卓の最上位である「十段」に到達した。現状AIの参戦が認められている範囲では最高ランクであり、勝率も人間よりも安定している。

そして8月29日、マイクロソフトは、Suphxの開発元が自社であったことを明かしたのだ。

開発の中心となったのは、中国・北京にあるマイクロソフトのリサーチ部門、Microsoft Research Asia。そこに、日本人の開発者も参加して作られたものだった。

「強い麻雀AI」がチェスや囲碁よりも難しい理由

suphx-3

日本マイクロソフト・執行役 最高技術責任者(CTO)の榊原彰氏。

撮影:西田宗千佳

そもそも、麻雀をプレイする「強いAI」ができることには、どういう意味があるのだろう?

囲碁や将棋はAIが人間のトッププロに勝つ、という状態になって久しい。2016年、グーグル傘下のDeepMindが開発した「AlphaGo」が韓国のプロ棋士・李世ドルに勝利したのは象徴的な出来事だった。

日本マイクロソフト・執行役 最高技術責任者(CTO)の榊原彰氏は、「チェスや囲碁と麻雀では、強いAIを作る難しさが全く異なる」と説明する。

数学的には、チェスや将棋は、対戦相手がこれまでに採った手を完全に再現することができる「完全情報ゲーム」と呼ばれるものだ。盤面上で採りうる手が多いほど強いAIを作るのは難しく、「囲碁でプロ棋士に勝つAI」を開発するのは大きなハードルだったが、いまやそれもクリアーされた。

「完全情報ゲームでは、AIは無敵であることが証明されたに等しい」と榊原CTOも話す。

一方で、世の中にあるゲームには、完全情報ゲーム「ではない」ものも多い。自分からは相手の手が見えず、捨てたカードや自分の手札だけで次の行動を判断しないといけないゲームのことだ。これを「不完全情報ゲーム」という。ポーカーやブラックジャックのようなカードゲームは「不完全情報ゲーム」であり、麻雀もその一つだ。

不完全情報ゲームのAIは非常に難しい。これはグラフでイメージするとわかりやすい。

suphx-5

不完全情報ゲームは「プレイヤーから隠れている情報」がある分だけ、完全情報ゲームであるチェスや囲碁より複雑。特に麻雀は隠れている情報の量が桁違いに多い。

出典:マイクロソフト

次の手を決めるために検討すべき情報は、完全情報ゲームの場合、隠れている情報がないので「直線」で表せる。だが、不完全情報ゲームでは隠れている情報があるので「面積」になる。

2017年、米カーネギーメロン大の研究者が、ポーカーの一種である「テキサス・ホールデム」で、プロ4人との勝負に勝つ、という実績を残している。ただし、テキサス・ホールデムの中でもプロがあまり選ばない1対1の「ヘッズアップ」というルールでのものなので、ポーカーの専門家の間では評価が分かれている。

shutterstock_367012106

Shutterstock

麻雀は、テキサス・ホールデムよりはるかに情報量が多い。

隠された情報量が圧倒的に多いということは、人間のもつ直感力・読みの能力などが重要で、コンピューターには難しい題材といえる。だからこそ、特にアジアでの研究が盛んなのだが、マイクロソフトはそこで大きな成果を見せたことになる。

ちなみに、一般的な麻雀ゲームに使われている麻雀AIは人間より相当に弱い上に、「他人の牌を見る」などのズルをしてゲーム性を担保している場合が多い。ここでいう「麻雀AI」はもちろん、人間のプレイヤーと同じように、一切のズルをしない、フェアなものを指す。これで人間のトッププレイヤー並の強さを実現するのは相当に難しい。

自ら学んで「勝負強いAI」に、将来的には金融系にも活用

ここで非常に面白いことがある。

強いAIを作るには、やはり開発者も麻雀が強くなければいけないのでは……。そう思いがちだ。だがマイクロソフト側によれば、「少なくとも日本から参加している開発者は、特に強くない」(マイクロソフト広報)「開発チームが麻雀に強い、という認識はしていない」(榊原CTO)という。

Suphxは自ら、他の麻雀のプレイから学ぶことで強くなった。

天鳳の中でSuphxは5000局以上を戦った。その中でも強くなったが、その前には、天鳳に公開されている過去の大量の牌譜(対戦データ)から学ぶ過程があった。

まずは全手配をオープンにした状態で学習、その後、実際のプレイと同じように自分以外の手を隠し、学習を進めた。

実は天鳳がパートナーに選ばれたのも、牌譜がすべて公開されており、学習に使える、という事情が大きかったようだ。

TIMA8817

ある日の東京証券取引所(写真はイメージです)。

撮影:今村拓馬

結果としてSuphxは強くなった。もちろん、単に「うまく上がる」だけではない。

麻雀は8局の勝敗で得られた点数で勝敗が決まる。人間の上位プレイヤーがそうであるように、天鳳も「8局での勝敗」を考えて対局している。

そのため、「いまは上がれないが、トップに来そうなライバルに勝たせないため、3位以下のプレイヤーにわざと安い手で勝たせる」といった戦い方もしてくる。総合的な局面を読む能力を持っているのだ。

麻雀が強いAIが、どんな役に立つのか、よくわからない人も多いだろう。

実際、直接他のAIにすぐそのまま役に立つわけではない。だが、「過去の情報から流れを適切に読む」能力は、自動運転などにも通じる要素がある。

榊原CTOは、Suphxから得られる知見が生かされる方向性を次のように予測している。

「個人的には、金融分野で応用できるのではないか、と思っている。優秀なトレーダーは市場の流れをうまく『読む』もの。そうした要素に近いのではないか」(榊原CTO)

すなわち「勝負強いAI」を作るために、麻雀の強さが生きてくる、ということなのかもしれない。

なお、天鳳では、コミュニティと相談の上、「AIを最上位の天鳳卓に参加させる」ことも検討しているという。

ちなみに、過去最上位の「天鳳位」を得たプレイヤーは、33万人中わずかに13人しかいない。

(文、写真・西田宗千佳)

Popular

あわせて読みたい

BUSINESS INSIDER JAPAN PRESS RELEASE - 取材の依頼などはこちらから送付して下さい

広告のお問い合わせ・媒体資料のお申し込み