最近的新闻报道强调了强化学习算法如何在围棋、Dota 2和星际争霸2等游戏中击败专业人士。强化学习是一种机器学习,可以将人工智能应用于视频游戏、机器人、自动驾驶汽车等复杂应用中。

如果您对在项目中使用强化学习技术感兴趣,但您以前从未使用过它,那么您应该从哪里开始呢?

这本电子书将帮助你在MATLAB中开始强化学习®和仿真软万博1manbetx件®通过解释术语并提供示例、教程和试用软件。

阅读这本电子书了解:

第一部分:了解基础知识和建立环境
了解加强学习的基础知识以及它与传统控制设计的比较。看看监督,无监督和强化学习之间的区别,看看如何在Matlab和Simulink中设置学习环境。万博1manbetx

第二部分:理解奖励和政策结构
学习强化学习中的探索和利用,以及如何形成奖励功能。探索表示策略(包括神经网络)的不同选项,以及如何将它们用作函数近似器。

第三部分:理解培训和部署
了解不同类型的培训算法,包括基于策略的值和基于价值的和批评者的方法。了解有关每种培训方法的优缺点以及流行的Bellman方程式的更多信息。最后,在部署培训的策略之前,请参阅您应该考虑的内容,以及与此技术相关的总体挑战和缺点。

30天免费试用

尝试MATLAB, Si万博1manbetxmulink等等。

开始