「十六式いろは」のあれこれ

コンピュータ将棋ソフトのエンジン「十六式いろは」の開発者のブログです。

python-dlshogi2の学習と感想

python-dlshogi2の学習と感想

学習データについて

  • 書籍「強い将棋ソフトの創りかた」の第5章にある方法
  • floodgateの2020年の棋譜
  • レーティング3500以上
  • 局面数は2,552,625(約250万)

学習方法

書籍では1周だったが、
学習データを20周(20epoc)まで学習させた。

棋力測定方法

将棋所を使い、いくつかのソフトと戦わせた。
GPU:GTX1660Ti使用。1手5秒。
CPU:Core i7-10750H。4スレッド使用。

Lesserkai 1.4.2 : Rt.0770 アマ5級
Kaitei_WCSC27 : Rt.1006 アマ3級(得意戦法をもっている)
Kaitei SDT5 : Rt.1259 アマ1級(近所で無敵)
Kaitei_WCSC28 : Rt.1620 町道場初段
Laramie V3 : Rt.1787 町道場三段
shogi686 wcsc26 : Rt.2033 アマ県大会レベル

Rt.(レーティング)について

参考サイト:コンピュータ将棋 レーティング
https://uuunuuun.wixsite.com/shogi-engines
将棋フリーソフトのELOレーティング評価。
レートは強さ(棋力)の指標です。

結果

checkpoint-013が一番強いが、checkpoint-006と接戦。
ほぼ同等と言っても良い。
6周目までのもの(checkpoint-001からcheckpoint-006)では
checkpoint-003が強い結果になった。

2枚目の画像は
「psd2_CPU-003」が「checkpoint-013」、
「psd2_CPU-010」が「checkpoint-006」という意味。

f:id:juuryokushiki168:20220104133921p:plainf:id:juuryokushiki168:20220104133924p:plainf:id:juuryokushiki168:20220104133926p:plain
学習結果

感想

checkpoint-003について

  • コスパが良い感じ。
  • accuracy2(価値ネットワークの正解率)が最大値になっている。
  • これ以上の学習は同じ学習データだと、棋力が下がるか似たりよったり。
  • Rt.1740(予測値) / 一般的には町道場二段レベル?
  • floodgateでの将棋倶楽部24のレーティング換算で、R.1752なので予測値は良い感じかと。

    Kaitei SDT5 : Rt.1259 アマ1級(近所で無敵)
     勝率100% : 10win 0lose
    Kaitei_WCSC28 : Rt.1620 町道場初段
     勝率070% : 7win 3lose
    Laramie V3 : Rt.1787 町道場三段
     勝率010% : 1win 9lose
    shogi686 wcsc26 : Rt.2033 アマ県大会レベル
     勝率010% : 1win 9lose

f:id:juuryokushiki168:20220105192811p:plain
floodgateでのcheckpoint-003

checkpoint-001について

  • 20周までで一番勝率が低い。
  • 学習不足と思われる。
  • Rt.1690(予測値) / 一般的には町道場二段レベル?

    Lesserkai 1.4.2 : Rt.0770 アマ5級
     勝率100% : 10win 0lose
    Kaitei_WCSC27 : Rt.1006 アマ3級(得意戦法をもっている)
     勝率060% : 6win 4lose
    Kaitei SDT5 : Rt.1259 アマ1級(近所で無敵)
     勝率070% : 7win 3lose
    Kaitei_WCSC28 : Rt.1620 町道場初段
     勝率060% : 6win 4lose

総合的な考察

checkpoint-003以降は、棋力が伸び悩む。
少なくとも3周学習すれば良さそう。

↓↓↓ checkpoint-003(82MB)をダウンロード ↓↓↓
drive.google.com