●コンピュータの囲碁ソフトが、15年10月に現欧州チャンピョンを破ったという記事がワイアードにあがっていた。五局やってすべて勝った、と。グーグルが2014年に買収したディープマインドという会社がつくった「AlphaGo」というソフトだという。
(「囲碁の謎」を解いたグーグルの超知能は、人工知能の進化を10年早めた)
http://wired.jp/2016/01/31/huge-breakthrough-google-ai/
将棋では、もはや完全に人間は将棋ソフトに勝てなくなっているが、囲碁はまだ大丈夫だとされていた。囲碁では、一手のうちに250通りの可能性があり、それぞれの手について次の手にはまた250通りの違う手があり得る。《囲碁では宇宙に存在する原子よりたくさんの手数があるのだ》、と。その計算はあまりに膨大であり、故に「直観」がモノをいい、機械が人間を負かすことはまだまだ困難であろう、と。
で、その困難を克服したのはまたもや「ディープラーニング」であるという。
《2014年末ごろから、エディンバラ大学やフェイスブックの研究者、ディープマインドのチームなど一部のAI専門家たちが、ディープラーニングを囲碁のプログラムに適用し始めた。この手法を使えば、囲碁が必要とする一流棋士の直感を模倣できるというわけだ。「棋士たちは、無意識的にパターンの照合を行っています」とハサビスは説明する。「ディープラーニングはそれをとてもうまくやるのです」》
●具体的な過程としては、まず、膨大な棋譜を機械に憶えざせることと、次に、それによってある程度強くなった機械同士を戦わせ、互いに研鑚を積ませる(この過程でディープラーニングが使われる)、というやり方である、と。最初は過去のデータが頼りであるが、それ以降は、自らが学習する過程で「新たなデータ」を生み出し、それをもとにさらに強くなってゆくのだ、と。
《ディープマインドの研究者たちは約3,000万に上るトップ棋士のさまざまな打ち手を集め、プログラムが自分で囲碁を打てるように訓練した。ただ、これはまだ第一段階にすぎなかった。理論的には、こうした手法ではプロの棋士たちと同じくらい強いソフトウェアしか生み出すことしかできない。研究者たちが取った次のステップは、ソフトウェア同士を戦わせて打ち手を収集し、これを使って名人を倒すことのできる新しいAIを養成することだった。》
《(…)3,000万種類の棋士の手を学ばせたあとで、彼らのAIは57パーセントの確率で人間の次の手を予測することができた。その前の記録が44パーセントだったことを考えれば、素晴らしい数字だ。ハサビスと彼のチームはそれから、このニューラルネットワークをわずかに異なる亜種のネットワークと対戦させた。自己研鑽と呼ばれるステップだ。原則的には、システムはどの手が最大の報酬をもたらすか、つまり囲碁の場合は最大の陣地を獲得できるかを追跡する。回数を重ねるにつれ、AIはどの手が機能し、どれはうまくいかないかを理解することに長けていくようになる。》
《「AlphaGoは自分と同じニューラルネットワークと何百万回もの試合をすることで、自らが使う戦略を発見することを学びました。そしてだんだんと上達しています」》
《AlphaGoはこのプロセスでCrazystoneを含むほかの囲碁プログラムを倒した。研究者たちは次に、この結果を第2のニューラルネットワークに組み込んだ。ネットワーク2号は1号が導き出した手を取り入れ、それぞれの手の結果を予想するのに多くの同じ技術を使った。(…)AlphaGoはこのようにして、既存の囲碁プログラムだけでなくプロの棋士をも倒すまでに成長していった。》
●画像の、入力→(圧縮と解凍)→出力→評価→重みづけ変化→再入力を何万回も繰り返すことで抽象概念のようなものを獲得するのが「グーグルの猫」だとすると、同様の過程を通じて「最大の陣地の獲得」を生み出す打ち手を、機械が機械同士の対戦を通して自分自身で探って行く、ということでいいのだろうか。
こうしてみると、「膨大な棋譜を憶えたから強くなっただけだ」とか、「ビッグデータは過去のデータの集積だから想定外の事態に対応できない」という考えが完全に間違っているのが分かる。微妙に異なるソフト同士が対戦することを通じて、まさに「想定外の事態」を自ら作り出しつつ、それを自ら学習し、新たな解決を生み出している、とも考えられる。その過程は、《「ヒューマンレヴェルでは理解できないのです」》というようなものなのだろう。
ここで、囲碁ソフトは自らの力(と、自らのやり方)で自分自身を高めているのであって、その過程に「人間」の存在は必要がない、というか、人は役に立たない。これはすごく怖い事だ。そしてこのことが、ただ「囲碁」にかんすることだけに限定されるはずはない。
《AlphaGoの重要性はとてつもないものだ。同じ技術はロボティクスや科学研究だけでなく、Siriのようなモバイルデジタルアシスタントから金融投資まで、さまざまな用途に応用が可能である。「対立に関すること、つまり戦略が重要になるようなゲームとして思いつくものには何にでも適用することができる」。ディープラーニング研究を行うスタートアップ「Skymind」創業者のクリス・ニコルソンは指摘する。「これには戦争やビジネス、金融取引も含まれるんだ」》。
《AIは人間が与えたデータから学習しているだけでなく、自分で囲碁を打つことからも学んでいる。つまり、自分自身でデータをつくり出しているのだ。テスラモーターズの創業者イーロン・マスクなどは最近、AIが人智を凌駕し、人間のコントロールから抜け出してしまう可能性への懸念を表明している。》
●すぐれたAIをつくったものが、そのまま、あらゆる「戦略的なもの」に勝利し、経済的、政治的に、圧倒的な優位に立つ、としたら。AI技術の開発は、それ自体が既にほぼ「戦争」と同義である、と言ってしまってもいいことになるのではないか。そしてこの戦争は、結局は「人間の勝者」が誰もいないものになるかもしれない。