更新履歴
2022-12-21 v39 更新をお願いします。cPUCTを動的に変更、王が逃げる手1手を延長で、+25 Elo強くなっています。棋譜にNNの生のValueとPolicyを記録するように。w4201、6194万棋譜から。
2022-11-09 学習率を大きくして序盤や早い投了棋譜の学習割合を減らすと+64 ELO強くなったので重みを差し替えました。w4177、6123万棋譜から。
2022-08-21 GCTの棋譜だけから学習させると+105 ELO強くなりました。
2022-07-29 v37 更新をお願いします。kldgainを0.000005から0.00000075に。平均playout数が772から1568に増えます。1手800playoutから1手1600playoutと倍の強さで学習棋譜を生成して重みに変化が出るのか確認します。w4103、5902万棋譜から。
2022-06-24 v36 更新をお願いします。歩角飛の不成を読まないように。王手での素抜き空き王手で駒を取る手の読み抜けを強制補正。kldgainを0.000006から0.000005に。平均playout数が729から772に増えます。w4062、5778万棋譜から。
2022-06-20 AobaZeroの駒の価値をAobaZeroの棋譜から計算してみました。盤上の龍の価値が高いです。250手以上では歩香桂はマイナスになります。
2022-04-30 v34 更新をお願いします。王手がからむ千日手のバグ修正とdfpnでの時間打ち切りを追加しました。w3977、5523万棋譜から。
2022-04-18 v32 更新をお願いします。勝率の初期値を負けから親ノードの勝率を元に変更し(+20 ELO)、すべてのノードでdfpnで詰を読むようにしました(+40 ELO)。合計で+60 ELOほど強くなってます。w3954、5454万棋譜から。
2022-04-07 v30 更新をお願いします。Policyを出力する温度を1.0から1.8に変更しました。+50 ELOほど強くなってます。30手までのランダム性を元のAlphaZero形式に戻しました。勝率がある範囲に収まるような調整がまずく、初期局面でのすべての手の勝率が同じ値になっていました。kldgain=0.000006に。1手平均789playoutです。w3933、5393万棋譜から。
2022-02-25 v28 更新をお願いします。ネットワークの構造を変更しました。利きの情報を利用し、3手詰を調べます。30手までのランダム性を1手後のValueを元にしました。w3881、5239万棋譜から。
2022-01-10 v18 更新をお願いします。1手800playout固定でなく、100~3200まで可変にしました(平均777playout)。生成される棋譜の棋力は+76 ELOほど強くなります。kldgain=0.0000013。w3806、5013万棋譜から。
2021-12-25 valueの学習を「実際の勝敗」から「実際の勝敗」+「探索勝率」の平均、に変更しました。Aoba駒落ちだと+20 ELOの効果でした。w3770、4905万棋譜から。温度1.3は+33ELOの上昇でした。
2021-09-30 v2.0 v1.9以下では動作しません。更新をお願いします。30手までの温度を1から1.3に変更して多様な手を生成するようにしました。強くなるかは不明です。20blockでの生成になります。47075521棋譜までが40blockで47075522棋譜から20blockです。学習には40blockの棋譜は使っていません。w3703はw3459(最後の20block)と同じものです。
2021-09-30 40blockの学習を終了しました。ありがとうございました。サーバを停止します。今後は近日中に20blockで実験的なサーバを立てる予定です。
2021-09-05 学習率が 0.000001 から 0.0000005 に7月30日に変更されていました。4446万棋譜、w3616から新しい学習率です。
2021-04-27 AlphaZeroの追試を終了して40 blockに移行しました。3982万棋譜。w3459が最後の20 blockでw3460から40 blockです。ありがとうございました!
2021-03-11 weight_decay(L2正則化)を 0.00004 から 0.0002 に戻しました。3498万棋譜、w3299から。
2021-01-31 学習率を0.0000002に変更しました。3047万棋譜、w3148から新しい学習率となります。
2021-01-11 過去50万棋譜から過去100万棋譜のサンプリングに変更しました。2835万棋譜、w3077から。
2020-12-28 weightの更新を10000棋譜から34285棋譜ごと(学習回数は32000回)に変更しました。2670万棋譜、w3022から。
2020-12-11 v1.9 先手番で相手を詰せたときに勝ち(+1)でなく負け(-1)がNNの出力として返るのを修正しました。
2020-12-06 weight_decay(正則化)を 0.0002 から 0.00004 に変更しました。2398万棋譜、w2750から。2400万棋譜に到達しますが、もうしばらく学習条件の変更をしてみたいと思います。
2020-12-01 v1.8 棋譜に投了閾値を追加しました。%TORYO,'autousi,resign-th=0.229996,v=0.230,... など。
2020-11-23 v1.7 v1.6以下では動作しません。更新をお願いします。棋譜生成で投了勝率の自動調整。棋譜ファイルの仕様変更。
2020-11-21 開発版(develop)でないと棋譜生成はできません。Release版はしばらくお待ちください。投了の勝率が自動調整になりサーバを変更。棋譜の仕様が変更になっています。+6978KI,'v=0.545,800,6978KI, ... のようにコメントの先頭にv=で勝率が追加されます。"-r" オプションが付いている棋譜からが対象です。2212万棋譜、w2564から。
2019-10-25 v1.6 v1.5以下では動作しません。更新をお願いします。棋譜生成で勝率10%で投了するように。
2020-10-24 棋譜生成で投了(develop)するように。1895万棋譜、w2250から。
2020-10-22 v1.5 OpenCL使用時に5倍ほど速くなりました。
2020-09-28 学習率を0.000002に変更しました。1694万棋譜、w2047から新しい学習率となります。
2020-07-08 学習率を0.00002に変更しました。1098万棋譜、w1450から新しい学習率となります。詳細はこちらを。
2020-06-28 Colabで開発版(develop)を使うことで13倍ほど高速(Tesla T4の場合)に棋譜を生成できます。
2019-11-08 学習率を0.0002に再度変更しました。434万棋譜、w787から新しい学習率となります。詳細はこちらを。
2019-10-29 学習率を0.02に下げました。422万棋譜、w775から新しい学習率となります。詳細はこちらを。
2019-07-09 v1.4 v1.3以下では動作しません。更新をお願いします。棋譜生成で乱数の初期値が一定なのを修正しました。
2019-07-08 v1.3 探索木の再利用、将棋所の検討で読み筋と評価値を表示するようにしました。
2019-05-29 v1.2 v1.1以下では動作しません。更新をお願いします。
MCTSの勝率の初期値を引き分け(0)から負け(-1)に変更。これによりv1.1に勝率0.80ほどで勝ち越します。
2019-05-01 v1.0 ソース、実行環境を公開しました。
2020年 9月 4日(金)の18時から27時間、サーバを停止します。停電のためです。ご不便をおかけしますが、よろしくお願いします。
2019年11月30日(土)の夜20時から24時間、サーバが停止します。停電のためです。ご不便をおかけしてすみません。
2019年 9月 7日(土)の朝8時から24時間、サーバが停止します。停電のためです。ご不便をおかけしますがご了承下さい。
2019年 7月 6日(土)の14時から24時間、サーバを停止します。これはバックアップとOSの更新、v1.3への更新のためです。ご不便をおかけしますがご了承下さい。