最近的新闻报道强调如何强化学习算法游戏,如GO,DOTA 2和星际2强化学习,现在击败专业人士是一种机器学习,使从视频游戏到机器人技术,自我复杂的应用程序中使用人工智能-driving汽车,等等。

如果您有兴趣使用强化学习技术,为您的项目,但你以前从未使用过它,你在哪里开始呢?

这本电子书将帮助您开始使用MATLAB中的强化学习®和Sim万博1manbetxulink®通过解释术语和提供访问的例子,教程和试用软件。

下载电子书来了解:

第1部分:基础和设置环境

学习强化学习的基础知识以及如何将其与传统的控制设计比较。见监督,不受监督,并强化学习的区别,看看如何设置MATLAB和Simulink的学习环境。万博1manbetx

第2节:奖励和政策结构

了解如何在强化学习的勘探和开发,以及如何塑造奖励功能。探索代表包括神经网络,以及他们如何可以作为函数逼近的政策不同的选择。

第3部分:了解培训和部署

了解不同类型的培训算法,包括基于策略的,以价值为基础和演员评论家方法。了解更多关于每次训练方法的优点和缺点,以及流行的Bellman方程。最后,看你部署训练有素的政策,以及与此相关的技术挑战,全面和缺点之前,应该考虑什么。