强化学习 Reinforcement Learning Python 教学教程

  • 阅读 10692
  • 格式
  • 大小 0B
  • 百度网盘
  • 2017-09-09
  • 收藏

用 python 实现强化学习教程

教程列表:

#1 什么是强化学习? (Reinforcement Learning)

#2 强化学习方法汇总 (Reinforcement Learning)

莫烦 #1 why? (强化学习 Reinforcement Learning 教学教程)

莫烦 #2 要求准备 (强化学习 Reinforcement Learning 教学)

#3 什么是 Q Learning (Reinforcement Learning)

莫烦 #3 简单例子 (强化学习 Reinforcement Learning 教学)

莫烦 #4 Q Learning 算法更新 (强化学习 Reinforcement Learning 教学)

莫烦 #5 Q Learning 思维决策 (强化学习 Reinforcement Learning 教学)

#4 什么是 Sarsa (Reinforcement Learning 强化学习)

莫烦 #6 Sarsa 算法更新 (强化学习 Reinforcement Learning 教学)

莫烦 #7 Sarsa 思维决策 (强化学习 Reinforcement Learning 教学)

#5 什么是 Sarsa(lambda) (Reinforcement Learning 强化学习)

莫烦 #8 Sarsa(lambda) (强化学习 Reinforcement Learning 教学)

#6 什么是 DQN (Reinforcement Learning 强化学习)

莫烦 #9 DQN 算法更新 (强化学习 Reinforcement Learning 教学)

莫烦 #10 DQN 神经网络 (强化学习 Reinforcement Learning 教学)

莫烦 #11 DQN 思维决策 (强化学习 Reinforcement Learning 教学)

莫烦 #12 OpenAI Gym (强化学习 Reinforcement Learning 教学)

莫烦 #12.1* Double DQN (强化学习 Reinforcement Learning 教学)

莫烦 #12.2* DQN with Prioritised Replay (强化学习 Reinforcement Learning 教学)

莫烦 #12.3* Dueling DQN (强化学习 Reinforcement Learning 教学)

莫烦 #7 什么是 Policy Gradients (Reinforcement Learning 强化学习)

莫烦 #13 Policy Gradients 算法更新 (强化学习 Reinforcement Learning 教学)

莫烦 #14 Policy Gradients 思维决策 (强化学习 Reinforcement Learning 教学)

莫烦 #8 什么是 Actor Critic (Reinforcement Learning 强化学习)

莫烦 #15 Actor Critic 演员评论家 (强化学习 Reinforcement Learning 教学)

莫烦 #8 什么是 Deep Deterministic Policy Gradient (DDPG)(Reinforcement Learning 强化学习)

莫烦 #16 DDPG (强化学习 Reinforcement Learning 教学)

#9 什么是 A3C (Asynchronous Advantage Actor-Critic) (Reinforcement Learning 强化学习)

莫烦 #17 A3C (强化学习 Reinforcement Learning 教学)

莫烦 #18 PPO/DPPO Proximal Policy Optimization 强化学习

✅当您赞助下载文档后,您只能预览,并不意味着购买了版权,不得用于商业用途(直接或间接盈利),下载后请24H内删除。
✅本站所有内容均由热心网友分享赠送,本站不对文档的完整性、权威性及正确性做任何保证或承诺!文档内容仅供预览参考。

1、打开文档需要使用基本的办公软件,如Word、Office、WPS、Pdf、Cad、Rar、Zip等。

2、如遇下载失败、解压失败、文档缺失等问题,请通过【反馈】按钮提交。

最新文档分享
确认删除?