M1 Macbook Air でふかうら王（やねうら王ディープラーニング版）を動かしてみた

やねうら王は通常のCPU探索以外にディープラーニングを使った思考ルーチンも利用できる。それが「ふかうら王」だ。名前の「ふか」はたぶん「ディープ」から来ているのだろう。

ディープラーニングはCPUでやらせると時間がかかるので、GPUを使うのが普通である。下記の記事では、ROG-STRIX-RTX3090-O24G-GAMINGというGPUカードを使っていて、このカードだけでも価格は２０万円を超える。合計約140万円とのこと。恐ろしい世界である。

将棋専用機に140万もかけるのはプロならではの話で、私のような弱い将棋ファンには強力なGPUがあっても宝のもちぐされである。いつも使っているM1 Macbook Airの内蔵GPUでお手軽に動かせないかと調べていたら、いつのまにか、M1 Mac用のふかうら王がリリースされていた。ありがたい。

コンパイルと設定
速度について
リンク

コンパイルと設定

慣れている人なら、やねうら王添付のドキュメントを読めばコンパイル＆設定できますし、コンパイル済のバイナリも公開されています。「評価関数モデルとして、ONNX形式ではなくApple特有のMLModel形式が必要」なのが注意点。

エンジン設定はこんな感じにしてみました。ハッシュはもっと大きくしたほうが良いかな？　他の微調整必要だと思うけど、とりあえず載せておきます。

将棋所や諸々の設定は前回記事を参照ください。

M1 Macbook Air でやねうら王を動かしてみた | ず’s 将棋

速度について

前回と同じく、やねうら王ベンチマークを動かしてみました。秒あたり1300局面ほど調べているようです。M1用ではないバージョンだと７１局面/秒なので、格段に速くなっています。素晴らしい。

パッチを作ってくださったselect766さんの記事^※１でも1300NPS程度とのことですので、正しく設定できていそう。
（なお、やねうら王とは探索の仕組みが違うので、NPSの直接比較はできません）

※１ふかうら王でMacのCoreMLを使う（成功） – select766’s diary

$ ./YaneuraOu-by-m1-deep2
bench 128 8 19
info string Start loading the model file, path = eval/model.mlmodel, gpu_id = 0, batch_size = 8
info string Loading already compiled model
info string The model file has been loaded, path = eval/model.mlmodel, gpu_id = 0, batch_size = 8
info string engine forward test. batch_size = 8, Processing time = 861ms.
（中略）
info string engine forward test. batch_size = 8, Processing time = 12ms.
info string All model files have been loaded. 2174ms.
Benchmark
hash : 128
threads : 8
limit : time 19
sfen : default
（中略）
===========================
Total time (ms) : 76217
Nodes visited : 95231
Nodes_visited/second : 1249
===========================
The bench command has completed.

以下はM1パッチが入る前に私がいじっていたバージョンでの測定結果。遅いです。

$ ./YaneuraOu-by-m1-deep
bench 128 8 19
info string Start loading the model file, path = eval/model.onnx, gpu_id = 0, batch_size = 32
2022-08-24 13:24:58.748 YaneuraOu-by-m1-deep[43847:4322204] 2022-08-24 13:24:58.747899 [W:onnxruntime:, helper.cc:61 IsInputSupported] Dynamic shape is not supported for now, for input:input1
info string The model file has been loaded, path = eval/model.onnx, gpu_id = 0, batch_size = 32
info string engine forward test. batch_size = 32, Processing time = 398ms.
（中略）
info string engine forward test. batch_size = 32, Processing time = 385ms.
info string All model files have been loaded. 3155ms.
Benchmark
hash : 128
threads : 8
limit : time 19
sfen : default
（中略）
===========================
Total time (ms) : 88493
Nodes visited : 6287
Nodes_visited/second : 71
===========================
The bench command has completed.