强化学习必修课:引领智能新时代-耿直哥学习课程视频资源

课程总共12章60节,从马尔科夫决策过程、动态规划、Q-learning,深度Q网络,策略梯度方法,到PPO,DDPG,注意力机制强化学习alphaStar,以及非常前沿的世界模型、多智能体强化学习等等。

在前两个章节中,学员将迎来强化学习世界的初次见面,了解课程的内容和理念,并对强化学习进行全方位的介绍。接着,第三章中将详细介绍环境安装和工具的使用,帮助学员为学习做好准备工作。

第四章至第十一章将逐个探讨强化学习核心概念和方法。学员将回顾数学基础知识,包括线性代数、微积分和概率,为后续学习奠定基础。之后,将探索马尔可夫随机过程和动态规划等经典方法,以及深度Q网络、深度策略梯度方法和基于模型的强化学习等先进方法。此外,课程还将介绍演员评论家算法,多智能体强化学习和强化学习的实战应用。最后两个章节将项目实战贯穿其中,学员将通过Gym游戏项目和大模型RLHF项目的实践,巩固所学知识,并了解强化学习领域最新的发展趋势。课程结束时,学员还将获得下一步学习建议,为进一步深入研究强化学习打下基础。

图片[1]-强化学习必修课:引领智能新时代-耿直哥学习课程视频资源-宝藏资源殿

资源目录:

1、第一章 欢迎来到强化学习的世界
│ 1_1-1-课程内容和理念.mp4
│ 2_1-2-认识强化学习.mp4
│ 3_1-3-课程使用的技术栈.mp4
2、第二章 数学知识回顾:凡事预则立 不预则废
│ 1_2-1-线性代数.mp4
│ 2_2-2-微积分.mp4
│ 3_2-3-概率.mp4
3、第三章 环境安装和工具使用:工欲善其事 必先利其器
│ 1_3-1-CUDA+Anaconda深度学习环境配置.mp4
│ 2_3-2-conda使用命令.mp4
│ 3_3-3-Jupyter-Notebook快速上手.mp4
│ 4_3-4-仿真环境Gym安装.mp4
│ 5_3-5-深度学习库PyTorch的安装.mp4
4、第四章 马尔可夫随机过程:憧憬和行动中追寻生命的意义
│ 1_4-1-序列建模与概率图模型.mp4
│ 2_4-2-马尔可夫观测过程:学会“看”.mp4
│ 3_4-3-马尔可夫决策过程:试着-“干”.mp4
│ 4_4-4-马尔可夫奖励过程:懂得“想”.mp4
│ 5_4-5-贝尔曼方程:迭代求解价值函数.mp4
│ 6_4-6-模型分类与选择.mp4
│ 7_4-7-常见问题解析.mp4
│ 8_4-8-马尔可夫过程代码实现.mp4
5、第五章 动态规划方法:理想国中的完美人生
│ 1_5-1-动态回归核心思想和原理.mp4
│ 2_5-2-策略迭代.mp4
│ 3_5-3-价值迭代.mp4
│ 4_5-4-动态规划代码实现.mp4
6、第六章 经典无模型方法:离散世界的价值最大化
│ 1_6-1-蒙特卡洛方法.mp4
│ 2_6-2-时序差分方法.mp4
│ 3_6-3-蒙特卡洛方法和时序差分代码实现.mp4
│ 4_6-4-广义策略迭代.mp4
│ 5_6-5-Q-Learning算法.mp4
│ 6_6-6-SARSA算法.mp4
│ 7_6-7-Q-Learning&SARSA代码实现.mp4
7、第七章 深度Q网络:他山之石 可以攻玉
│ 1_7-1-深度Q网络核心思想和原理.mp4
│ 2_7-2-DQN-代码实现.mp4
│ 3_7-3-常见问题改进和扩展.mp4
│ 4_7-4-DQN改进算法代码实现.mp4
8、第八章 深度策略梯度方法:行胜于言 止于至善
│ 1_8-1-策略梯度核心思想和原理.mp4
│ 2_8-2-蒙特卡洛策略梯度.mp4
│ 3_8-3-策略梯度方法代码实现.mp4
│ 4_8-4-近端策略优化算法.mp4
│ 5_8-5-近端策略优化(PPO)代码实现.mp4
9、第九章 演员评论家算法:戏为兄弟 共荣共生
│ 1_9-1-演员评论家算法核心思想和原理.mp4
│ 2_9-2-改进型演员评论家算法.mp4
│ 3_9-3-演员评论家算法代码实现.mp4
│ 4_9-4-深度确定性策略梯度.mp4
│ 5_9-5-DDPG算法代码实现.mp4
│ 6_9-6-软性演员评论家算法.mp4
│ 7_9-7-SAC代码实现.mp4
10、第十章 基于模型的强化学习:看不见的上帝之手
│ 1_10-1-基于模型的强化学习核心思想和原理.mp4
│ 2_10-2-Dyna-Q算法.mp4
│ 3_10-3-Dyna-Q算法代码实现.mp4
│ 4_10-4-基于模型的策略优化.mp4
│ 5_10-5-MBPO的代码实现.mp4
11、第十一章 进阶强化学习:欲穷千里目 更上一层楼
│ 1_11-1模仿学习.mp4
│ 2_11-2-博弈论与强化学习.mp4
│ 3_11-3-多智能体强化学习.mp4
│ 4_11-4-MADDP的代码实现.mp4
│ 5_11-5-AlphaStar系统.mp4
│ 6_11-6-基于人类反馈大强化学习.mp4
12、第十二章 强化学习实战:觉知此事要躬行
│ 1_12-1-项目实战:Gym游戏.mp4
│ 2_12-2-项目实战:大模型RLHF.mp4
│ 3_12-3-强化学习最新发展趋势.mp4
│ 4_12-4-下一步的学习建议.mp4

该课程全面而系统地涵盖了强化学习的各个方面,帮助学员从零开始构建起对强化学习的完整认识,并为他们在实践中运用强化学习提供了丰富的经验和技术支持。无论是想要从事强化学习相关工作的专业人士,还是对人工智能感兴趣的初学者,都可以通过本课程获得宝贵的知识和技能。

耿直哥深度学习必修课:进击算法工程师-宝藏资源殿
耿直哥机器学习必修课:经典算法与Python实战-宝藏资源殿
强化学习必修课:引领智能新时代-耿直哥学习课程视频资源-宝藏资源殿
强化学习必修课:引领智能新时代-耿直哥学习课程视频资源
此内容为付费资源,请付费后查看
会员专属资源
您暂无购买权限,请先开通会员
开通会员
付费资源
© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享