最近的新闻报道强调了强化学习算法如何在围棋、Dota 2和星际争霸2等游戏中击败专业人士。强化学习是一种机器学习,可以在从视频游戏到机器人、自动驾驶汽车等复杂应用中使用人工智能。

如果你有兴趣在你的项目中使用强化学习技术,但你以前从未使用过它,你从哪里开始呢?

这本电子书将帮助你在MATLAB中开始强化学习®和仿真软万博1manbetx件®通过解释术语并提供示例、教程和试用软件的访问。

阅读这本电子书,了解以下内容:

第1节:了解基础知识和设置环境
学习强化学习的基础知识,以及它与传统控制设计的比较。了解监督学习、无监督学习和强化学习之间的区别,并了解如何在MATLAB和Simulink中设置学习环境。万博1manbetx

第二节:了解奖励和政策结构
了解强化学习中的探索和开发,以及如何塑造奖励函数。探索不同的表示策略的选项,包括神经网络,以及如何将它们用作函数逼近器。

第3节:了解培训和部署
了解不同类型的训练算法,包括基于策略的、基于价值的和参与者-评论家的方法。找出更多关于每种训练方法的优点和缺点以及流行的贝尔曼方程。最后,了解在部署经过训练的策略之前应该考虑什么,以及与此技术相关的总体挑战和缺点。

30天免费试用

试试MATLAB、Sim万博1manbetxulink等。

开始