根岸の部屋

備忘録がてらに将棋(主にソフトとか角交換四間飛車とか)について書き殴ってます。棋力は絶賛伸び悩み中\(^0^)/ Twitter→@39th_theory

評価関数を自作してみる⑦ー1

 ここ数日の間、学習の条件はこれまで同じにしたままeval3~eval5を生成していた。

 以下はテスト対局の結果。探索部はすべてやねうら王4.72。

eval3 106-4-90 eval2 (1t0.1s)

eval3 97-0-3 epoch0 (1t0.1s)

eval3 83-0-17 eval1 (1t0.1s)

第3世代のeval3だが、ちゃんと強くなっていることがみてとれる。が、一世代前のeval2に勝率54%(引き分けは0.5勝0.5敗扱いとする)は低い。有意に強いといえるかも怪しく、早くもサチり気味である。大丈夫なのか。ちなみみeval3の気風は・・・普通。振り飛車要素のかけらもない相掛かり(横歩取り系含む)、角換わりばかりで、企画倒れの危機である。こっちの意味でも大丈夫なのかこれ。

 次はeval4。

eval4 23-0-26 eval3(1t0.1s)

 なんと、非常に少ない対局数とはいえ前世代に負け越している。どうしてこうなった。ほぼ同じ条件だった(はず)のuuunuuun氏のものはこのころでもまだまだ大幅に勝ちこしていたはずだが・・・。あまりにもおかしいので一手一秒と条件を変えて100局追加してみる。

eval4 56-3-41 eval3 (1t1s)

 上とあわせる(条件=時間が違うのに合わせていいのかはアレだが)と79-3-67。さすがに帳尻を合わせてきたが、それでもかなり物足りない感じ。

 ただ、このテストで見えてきたものがあった。時間を一手0.1秒から1秒にするとeval3、eval4ともに指し手が変わる。もっとはっきりいうと、

たまに飛車を振る。

 間違えてShogiGUIの内部定跡を導入してしまったのかと思ったが、調べると間違いなく自力の探索で飛車を振る手を選んでいる。epoch0以降しばらくは全く見られなかった傾向である。ついに定跡を用いた調教が表出し始めたのか。

 もうすこし詳しく書くと、振る頻度はeval4のがやや高い。先手番では全くと言っていいほど振らず(▲2六歩△3四歩▲7六歩△4四歩▲7八飛という変則的な相振りが一局のみ、先手eval3)後手のときのみたまーに振る。内訳はノーマル四間飛車10局、ノーマル向かい飛車、ゴキゲン中飛車、後手石田流、ダイレクトが1局ずつ。定跡のもととなった棋譜がノーマル四間飛車の割合が多かったためこのような比率となったのだろうか。

 ほかには早めに端歩を突くのをわりと好む、ほとんど美濃囲いにしないという特徴もみられるあたりがこちらの方↓

https://github.com/tibigame/HandicappedRook

と似ている気がする。特に美濃囲いを好まないというのは興味深い。既存の評価関数に無理やり振り飛車をやらせて定跡が切れた場合、ほとんどのケースが美濃囲い、たまに振り穴を採用していた。この自作評価関数も、上の評価関数(あまり確かめてないが)も美濃や振り穴は好まない。もしかすると至高の振り飛車に美濃囲いは不要なのか、それともいずれ美濃に収束していくのかは少し気になる。

 ここで、試しに浮かむ瀬評価関数(+やねうら探索)と手合わせしてみる。

浮かむ瀬 86-1-13 eval4 (1t1s)

 勝率86.5%はR340差相当。これを健闘したとみるかまだまだ未熟とみるか。コンピュータ将棋 レーティングを参考にすれば、最新やね+eval4は大樹の枝(の探索、評価関数)よりほんのりと強そうといったところか(未検証)。ただ棋譜や評価値グラフを見るに浮かむ瀬のほうが圧倒的に本筋だし、指し手の完成度も高く映った。肝心の振り飛車戦でも、たまたまダイレクト向かい飛車を浮かむ瀬が採用した(無論定跡不使用で)ときのほうがずっと振り飛車らしい振り飛車に見えた。

 さらにeval5を生成し、eval4と対局させる。

eval5 84-6-68 eval eval4 (4t1s)

 勝率55%は有意に強いとは言えなさそうだが、これ以上のテストは面倒なので省略。まあ多少は強くなっているはずだ。相変わらずレートはまもなく収束していくっぽい傾向だが、収束するには早すぎやしないかとも感じる。

 棋風だが、先手はほ居飛車オンリーなのは相変わらず。後手番で振るときも、振り飛車版elmo囲いをするなどの相変わらずの自由っぷりを発動させている。また角道オープン系の振り飛車が非常に少ないのは気になる。

 

<もうすこしだけ⑦-2につづく>