master

分支 (3)

管理

管理

master

one

16X16

gobang
/
config.py

CONFIG = {
    'current_policy_path': 'current_policy.pkl',  # pytorch 模型存放路径
    'train_data_buffer_path': 'train_data_buffer.pkl',  # 对局数据存放路径
    'mcts_temp': 1.0,  # 蒙特卡洛搜索中探索程度的参数
    'c_puct': 5,  # 蒙特卡洛搜索中控制探索和利用平衡的参数
    'n_playout': 400,  # 蒙特卡洛搜索中模拟次数
    'learn_rate': 2e-3,  # 策略价值网络中更新时使用的学习率
    'buffer_size': 10000,  # 经验池大小
    'train_update_interval': 300,  # 模型保存间隔
}