T.E.E.D 1104 是一个在视频游戏中运用监督学习学习驾驶的深度神经网络,基于 PyTorch,并使用了 Nvidia 的 Apex 扩展库,支持混合精度训练与推断,最多有两
使用pytorch复现强化学习基础代码,并保证模型训练收敛
tetris game with pytorch deep q-learning
Deep Q-learning for playing flappy bird game
最近一年贡献:209 次
最长连续贡献:6 日
最近连续贡献:2 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。