評価関数を自作してみる② ~お詫びと反省~
まずはじめにお詫びを。以下の記事↓
において、「振り飛車絞りした評価関数はepoch0に比べ全然強くなっていない」という旨の発言をしたが、あれはとんだ嘘っぱちだった。
あとでepoch0とeval2(筆者による自作評価関数。2回目に作ったもののため今後こう呼称したい)で対戦結果を計測しなおしたら、普通にかなり強くなっていました、はい。
1スレッド1秒でepoch0 18-0-182 eval。レートにして400程度(多分)の上昇と効果は甚大だった。誰だよ全然強くなってないとかいったやつは
恐らく上の記事の計測では、epoch0側の評価関数が、誤ってeval2のものに置き換えられてしまっていたのだろう。そのせいで均衡した対戦成績になってしまっていたのだ。実際、筆者の目視では前回と今回のepoch0側の形成評価グラフの形が全く違っていたのがそれを裏付けている。同じ評価関数どうしが戦っているのだからそれは当然有意差など付かないはずである。
というわけで、今回は私めの不手際によりデタラメ作文を公開してしまうことになってしまい大変申し訳なく思っている。今後はこのようなことがないようにしていきたい。
なお、現在はeval2からdepth3、1億局面+振り飛車定跡で再度絞ったeval3を生成して、どれだけ強くなったかを計測するべく自己対戦させているところである。結果が出次第、記事にしたい。