炼数成金 门户 培训 查看内容

《OpenAI强化学习实战》

2018-5-14 16:13| 发布者: 岸岸| 查看: 16451| 评论: 0|原作者: 岸岸

安全 深度学习 机器人 强化学习 AlphaGo

快速报名入口
普班报名:【普班】OpenAI强化学习实战(第六期) (2019/09/08开课)
快班报名:【快班】OpenAI强化学习实战 (随报随学)
      在过去的几年里,强化学习(RL,Reinforcement Learning)在很多方面取得了突破。DeepMind公司将深度学习与增强学习结合在一起,在众多的Atari游戏中来取得超越人类的表现,基于深度学习和强化学习训练得到的AlphaGo Zero更是完全从零开始,仅通过自我对弈就能天下无敌。虽然RL目前在许多游戏环境中都表现很出色,但它对解决需要最优决策和效率的问题而言是种全新方法,而且肯定会在机器智能中发挥作用。

      OpenAI成立于2015年底,是一个非营利组织。它的目的是“建立安全的人工通用智能(AGI),并确保AGI的福利被尽可能广泛和均匀地分布”。除了探索关于AGI的诸多问题之外,OpenAI对机器学习世界的一个主要贡献是开发了Gym和Universe软件平台。

      Gym是为测试和开发RL算法而设计的环境/任务的集合。它让用户不必再创建复杂的环境。Gym用Python编写,它有很多的环境,比如机器人模拟或Atari 游戏。它还提供了一个在线排行榜,供人们比较结果和代码。

课程大纲:
第1周 强化学习与常用的仿真环境平台介绍(MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2等)
第2周 OpenAI gym中的常用仿真环境介绍,包括Atari 2600 游戏系列、MuJoCo 物理模拟器、Toy text 文本环境、Robotics机械手与机械臂模拟器等
第3周 马尔科夫决策过程MDP
第4周 基于gym的MDP实例讲解,基于OpenAI Gym构建股票市场交易环境
第5周 基于gym的强化学习实践:基于值函数的强化学习方法实现;基于策略梯度的强化学习方法实现
第6周 虚拟环境Universe: 一个用于训练解决通用问题 AI 的基础架构
第7周 基于Universe的强化学习实践:用OpenAI公司的Gym工具库和Universe平台为游戏创建人工智能机器人

开课时间:
本期课程将于9月8日开课,预计课程持续时间为9周

目标人群:
有简单的强化学习基础,希望学习强化学习的落地实现的同学

课程环境:
python3+OpenAI GYM+OpenAI Universe

收获预期:
学习结束后均能自己动手编写一个仿真环境,训练强化学习

授课讲师:

何翠仪  毕业于中山大学统计学专业,炼数成金专职讲师。
在炼数成金上开设了多门关于数据分析与数据挖掘相关的课程,如《大数据的统计学基础》、《大数据的矩阵基础》《金融时间序列分析》等,也曾到不同的公司开展R语言与数据分析的相关培训。对数据分析有深刻认识,曾与不同领域公司合作,参与到多个数据分析的项目中,如华为、广州地铁等

课程试听:

      <dir id='z6ux1'><del id='z6ux1'><del id='z6ux1'></del><pre id='z6ux1'><pre id='z6ux1'><option id='z6ux1'><address id='z6ux1'></address><bdo id='z6ux1'><tr id='z6ux1'><acronym id='z6ux1'><pre id='z6ux1'></pre></acronym><div id='z6ux1'></div></tr></bdo></option></pre><small id='z6ux1'><address id='z6ux1'><u id='z6ux1'><legend id='z6ux1'><option id='z6ux1'><abbr id='z6ux1'></abbr><li id='z6ux1'><pre id='z6ux1'></pre></li></option></legend><select id='z6ux1'></select></u></address></small></pre></del><sup id='z6ux1'></sup><blockquote id='z6ux1'><dt id='z6ux1'></dt></blockquote><blockquote id='z6ux1'></blockquote></dir><tt id='z6ux1'></tt><u id='z6ux1'><tt id='z6ux1'><form id='z6ux1'></form></tt><td id='z6ux1'><dt id='z6ux1'></dt></td></u>
    • <code id='z6ux1'><i id='z6ux1'><q id='z6ux1'><legend id='z6ux1'><pre id='z6ux1'><style id='z6ux1'><acronym id='z6ux1'><i id='z6ux1'><form id='z6ux1'><option id='z6ux1'><center id='z6ux1'></center></option></form></i></acronym></style><tt id='z6ux1'></tt></pre></legend></q></i></code><center id='z6ux1'></center>

        <dd id='z6ux1'></dd>

            <style id='z6ux1'></style><sub id='z6ux1'><dfn id='z6ux1'><abbr id='z6ux1'><big id='z6ux1'><bdo id='z6ux1'></bdo></big></abbr></dfn></sub>
            <dir id='z6ux1'></dir>