七月在线_强化学习 [一举解开AlphaGo Zero的百胜奥秘],全套视频教程学习资料通过百度云网盘下载-编程辅助(软件测试/编辑器/Git/Svn/..)-学途无忧

admin 发表于 2021-4-19 04:21:11

七月在线_ 强化学习 [一举解开AlphaGo Zero的百胜奥秘],全套视频教程学习资料通过百度云网盘下载

资源详情

七月在线_强化学习[一举解开AlphaGoZero的百胜奥秘]课程简介强化学习，被誉为可能通向强人工智能的第三类机器学习方法，在AI游戏领域的应用已司空见惯，如自动玩flappybird，借助强化学习玩星际争霸，最近非常火的王者荣耀也不例外；在无人驾驶、自动交易等领域也有着举足轻重的作用。《强化学习》课程，带你揭秘AlphaGo和星际争霸/王者荣耀，华尔街最热门的自动交易算法背后的技术及无人驾驶的关键点。课程特色1）从模型无关到模型相关，从Q-learning到Policygradient，全面涵盖主流强化学习内容知识2）与工业级ML算法紧密结合的应用案例讲解3）配套实验环境与GPU服务器第1课强化学习RL简介知识点1：强化学习定义：可能通向强人工智能的第三类机器学习方法知识点2：强化学习数学模型：马尔科夫决策过程（MDP）知识点3：RL机器人：探索环境，规划自己的人生知识点4：强化学习基本算法分类知识点5：Model-BasedRL:已知环境，如何优化自己的人生第2课Model—FreeLearning知识点1：环境未知，如何评估测略（状态价值）知识点2：蒙特卡洛方法学习状态价值函数知识点3：TD方法学习状态价值函数实战项目：两种方法比较及代码实现知识点5：OpenAIGym介绍第3课Model-FreeControl知识点1：ϵ−贪婪策略：平衡ExplorationandExploitation知识点2：on/off-policy蒙特卡洛方法知识点3：on/off-policyTD算法(Sara)实战项目：on/off-policy算法比较及代码实现第4课Q-Learning知识点1：Q-Learning知识点2：DeepQ-Learning实战项目：Q-learning解决山地车问题第5课策略梯度学习知识点1：蒙特卡洛策略梯度知识点2：Actor-Critic算法实战项目：用policygradient解决连续山地车的问题第6课TensorFlow强化学习应用案例实战项目：使用DeepQnetwork和Policygradient完成以下游戏：强化学习乒乓球游戏、强化学习flappybird

**** Hidden Message *****

YWADMIN 发表于 2024-2-6 16:49:34

啥也不说了，感谢楼主分享哇！

YWADMIN 发表于 2024-2-6 16:50:23

adasdasdasdasdasdasd

页: [1]

学途无忧's Archiver

七月在线_ 强化学习 [一举解开AlphaGo Zero的百胜奥秘],全套视频教程学习资料通过百度云网盘下载