根岸の部屋

管理人の備忘録がてらに将棋について書き殴ってます。棋力は絶賛伸び悩み中\(^0^)/

評価関数を自作してみる④

 epoch0から振り飛車定跡で絞った評価関数ができた。shivoray(シボレー)を動かして15時間ほど放置したところ完成した。この評価関数をeval1改と仮に名付けるとしよう。

 早速自己対戦させたところ、epoch0からみて14-0-186だった。勝率93%はレーティングにして450点差ほどだろうか。uuunuuun氏の実験結果とあまり変わらない結果となった。これから判断するに、おそらくeval1改は中身は前に公開したeval2とほぼ同じものかと思う。生成条件は変わっていないはずなので当然と言えば当然だが。

 ちなみにepoch0との棋譜を少しだけ眺めると、矢倉に似た形(といっても金矢倉のような3枚で囲うものでは無く、単に▲7七銀▲7八金などと組んだだけだが)などを覚えて確実に成長している跡がうかがえる。なぜ振り飛車定跡から矢倉を覚えたのか謎だが、ランダムムーブの所為だろうか。

 気になるのが、eval1改が振り飛車をほとんど選択していないことである。epoch0はたまに振るのだが、それに振り飛車定跡にエッセンスを加えたはずのeval1がむしろ振り飛車の価値を低く見ていると言うことである。これでは振り飛車向きの評価関数が本当にできあがるのか不安になってくる。

 とりあえず、eval1改に再びdepth3の1億局面で学習を回してみることにする。結果が出次第まとめたい。