Deepmind(Google)のAlphaZeroが将棋に参入

2017/12/07コンピュータ将棋

羽生七冠誕生で盛り上がっているところに、大ニュースが飛び込んできました。なんと、あのアルファ碁を作ったDeepmind社が囲碁と同じ手法でチェスと将棋も機械学習させ、人間のトップレベルを超えるAIを作成したという論文が投稿されたのです。

トップレベルのプログラムを超えた

白紙状態から自己対戦による学習を行ない、24時間で人間を超え、トップレベルのプログラムに勝つ強さになったとのことです。

Starting from random play, and given no domain knowledge except the game rules, AlphaZero achieved within 24 hours a superhuman level of play in the games of chess and shogi (Japanese chess) as well as Go, and convincingly defeated a world-champion program in each case.



3日間学習したプログラムが、WCSC27でPonanzaを破って優勝したelmoに90勝2敗8分とのこと。elmoの投了基準が早めなので再試が必要ではないかとの指摘もありますが、人間よりは圧倒的に強いのは間違いないと思います。elmoを超えるまで6時間というのは早すぎる。
(ちなみに3日間というのはGoogleのコンピュータパワーを使っての話。上等なPCでも110年かかるそうです)

[zuweet url=”https://twitter.com/nodchip/status/938339015111016449″]

下図は上達曲線。チェスも将棋も棋力が頭打ちになっているように見えるのが気になります。これは機械学習の方法の問題なのか、それともゲームの性質のせいなのでしょうか。囲碁ではまだまだ伸びる余地がありそうなのも面白い。

棋譜が見たい

論文にはチェスのオープニング(序盤)ごとの勝率が書かれていて、これはチェスに詳しい人から見ると興味深いデータのようです。
将棋についても同じような資料を出して欲しいものです。

論文の概要を知りたい方へ

リンク貼っておきます。コンピュータ将棋と機械学習の知識がないと難しいと思う。

コンピュータ将棋

Posted by