●これはかなりとんでもないことではないか。やばい。背筋が凍る。技術の進歩がはやすぎる。「アルファ碁、さらに進化=自己学習のみで最強に---グーグル」(時事通信) 10/19(木) 2:06配信
https://www.jiji.com/jc/article?k=2017101900097&g=int
《米グーグル傘下の英グーグル・ディープマインド社が開発したアルファ碁ゼロは、過去の対局などの学習用データ入力なしに、白紙の状態から自己対局を繰り返して、指し手や盤面の評価を自ら学んでいくプログラムを搭載。旧アルファ碁では、人間の指し手の学習と訓練に数カ月かかっていたのに対し、アルファ碁ゼロは数日間、約500万回の自己対局で性能を向上させた。プログラムの改良により、計算に用いるコンピューターチップの数も少なくて済むという。》
上の記事の意味するところはつまり、「囲碁」というゲームに関しては、完全に人間(の歴史)が必要なくなった(無意味化した)ということではないか。あるいは、人間が歴史的に追究してきた囲碁というゲームのあり様は、囲碁というゲームに内包される多様な可能性の、ほんのほんのごく一部、その傍流にすぎなかったのかもしれない、と。囲碁は今後、人工知能とともにそれ自体として自律進化していく。そこに人間の歴史や知はまったく関わることができなくなる、ということなのだろうか。おそらく人は、後付的に結果(理由)を追いかけることさえ、すぐにできなくなるのではないか。
●詳しくは、以下の英語の記事で。アルファ碁ゼロはたった三日間の(教師なし)学習で、旧アルファ碁に100連勝した、と。しかも、48台のマシンを必要とする旧アルファ碁に対し、アルファ碁ゼロは1台のマシンしか使っていない、と。
AlphaGo Zero Goes From Rank Beginner to Grandmaster in Three Days—Without Any Help (タイトルのグーグル翻訳「AlphaGoゼロは3日でランク初心者からグランドマスターへ---ヘルプなし」)IEEE SPECTRUM
https://spectrum.ieee.org/tech-talk/robotics/artificial-intelligence/alphago-zero-goes-from-blank-slate-to-grandmaster-in-three-dayswithout-any-help-at-all
《「AlphaGo Zeroは4台のテンソル処理ユニット(TPU)を持つ1台のマシンを使用していましたが、AlphaGo Leeは多くのマシンに分散され、48台のTPUを使用していました。AlphaGo ZeroはAlphaGo Leeを100試合で0に下した。》(クーグル翻訳)
DeepMindの研究者たちはもう少し奇妙なことを発見した。専門家の動きを予測するニューラルネットワークの訓練自体があったとき、それは非常にうまくいったが、人間の監督で訓練されたシステムの標準に達するのに少し時間がかかった。しかし、自己訓練されたネットワークは全体的に優れており、「AlphaGo Zeroは人間のプレーと質的に異なる戦略を学習しているかもしれません」と示唆しています。》(クーグル翻訳)