根岸の部屋

管理人の備忘録がてらに将棋について書き殴ってます。棋力は絶賛伸び悩み中\(^0^)/

自作評価関数に関する自分用メモ

 ほっとくと忘れるので書き置きしておく。ど素人の超低レベルな内容を大いに含む。

 

 

・教師局面の探索深さが及ぼす影響

・教師局面数の量が及ぼす影響

・定跡の戦型が及ぼす影響

・定跡の手数の長さ(深さ?)が及ぼす影響

・定跡の分岐(ツリー?)の数が及ぼす影響

・定跡の指し手のレベルが及ぼす影響

・bookdepthlimitを0にしないと定跡が読み込まれない、なんてことがないか不安になってきた。大丈夫だろうか。

・教師局面のファイルの内容は可視化できないのか(定跡がちゃんと読み込まれているかの確認に使いたい)

・既存の評価関数(エロ河童など)で教師局面をつくりそれをepoch0などに喰わせるとどうなるのか。

・複数の既存評価関数から一つの教師局面を作る方法(elmo3分の1、エロ河童3分の1、カパック3分の1など)。単純に継ぎ足しすれば良いのか?

・教師局面を使い回すとどうなるのか。また、使い回し方は何が適切なのか(教師局面の品質(探索深さ・局面数・評価関数)、学習させる順番など)

振り飛車定跡を与えて学習させても自力で振り飛車を指すようになるわけではないのか。その定跡を搭載しているという条件下限定での強さを獲得するに過ぎないのか。

・レート測定の方法は現状のままでいいのか。

・そのうち既存ソフト(過去のAperyなど)とのレートを測りたい。

・レート測定時の棋譜の内容をチェック。それなりの探索深さで対局させ棋力・棋風を調べる。

・できた評価関数において、振り飛車定跡搭載ver.と非搭載.verでのレートの差を調べたい。それぞれターゲットとなる何らかの他のソフトと対局させる、という方法で合っているのか。このときターゲットの対象にも定跡(まふ定跡その他)を搭載させるべきか。