请选择 进入手机版 | 继续访问电脑版
联系客服1
联系客服2

七月在线_ 强化学习 [一举解开AlphaGo Zero的百胜奥秘],全套视频教程学习资料通过百度云网盘下载

2
回复
138
查看
[复制链接]
  • TA的每日心情
    无聊
    2024-1-31 21:54
  • 签到天数: 724 天

    [LV.9]以坛为家II

    7189

    主题

    8572

    帖子

    129万

    积分

    管理员

    Rank: 9Rank: 9Rank: 9

    积分
    1297632
    发表于 2021-4-19 04:21:11 | 显示全部楼层 |阅读模式

    资源详情


    七月在线_强化学习[一举解开AlphaGoZero的百胜奥秘]课程简介强化学习,被誉为可能通向强人工智能的第三类机器学习方法,在AI游戏领域的应用已司空见惯,如自动玩flappybird,借助强化学习玩星际争霸,最近非常火的王者荣耀也不例外;在无人驾驶、自动交易等领域也有着举足轻重的作用。《强化学习》课程,带你揭秘AlphaGo和星际争霸/王者荣耀,华尔街最热门的自动交易算法背后的技术及无人驾驶的关键点。课程特色1)从模型无关到模型相关,从Q-learning到Policygradient,全面涵盖主流强化学习内容知识2)与工业级ML算法紧密结合的应用案例讲解3)配套实验环境与GPU服务器第1课强化学习RL简介知识点1:强化学习定义:可能通向强人工智能的第三类机器学习方法知识点2:强化学习数学模型:马尔科夫决策过程(MDP)知识点3:RL机器人:探索环境,规划自己的人生知识点4:强化学习基本算法分类知识点5:Model-BasedRL:已知环境,如何优化自己的人生第2课Model—FreeLearning知识点1:环境未知,如何评估测略(状态价值)知识点2:蒙特卡洛方法学习状态价值函数知识点3:TD方法学习状态价值函数实战项目:两种方法比较及代码实现知识点5:OpenAIGym介绍第3课Model-FreeControl知识点1:ϵ−贪婪策略:平衡ExplorationandExploitation知识点2:on/off-policy蒙特卡洛方法知识点3:on/off-policyTD算法(Sara)实战项目:on/off-policy算法比较及代码实现第4课Q-Learning知识点1:Q-Learning知识点2:DeepQ-Learning实战项目:Q-learning解决山地车问题第5课策略梯度学习知识点1:蒙特卡洛策略梯度知识点2:Actor-Critic算法实战项目:用policygradient解决连续山地车的问题第6课TensorFlow强化学习应用案例实战项目:使用DeepQnetwork和Policygradient完成以下游戏:强化学习乒乓球游戏、强化学习flappybird




    游客,如果您要查看本帖隐藏内容请回复
    回复

    使用道具 举报

  • TA的每日心情
    擦汗
    2024-2-6 16:46
  • 签到天数: 48 天

    [LV.5]常住居民I

    2

    主题

    133

    帖子

    2183

    积分

    终身会员

    Rank: 6Rank: 6

    积分
    2183
    发表于 2024-2-6 16:49:34 | 显示全部楼层
    啥也不说了,感谢楼主分享哇!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    擦汗
    2024-2-6 16:46
  • 签到天数: 48 天

    [LV.5]常住居民I

    2

    主题

    133

    帖子

    2183

    积分

    终身会员

    Rank: 6Rank: 6

    积分
    2183
    发表于 2024-2-6 16:50:23 | 显示全部楼层
    adasdasdasdasdasdasd
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    学习课程!一站搞定!
    学途无忧VIP会员群

    973849140

    周一至周日9:00-23:00

    反馈建议

    1227072433@qq.com 在线QQ咨询

    扫描二维码关注我们

    学途无忧!为学习谋坦途,为会员谋福利!|网站地图