最近的新闻报道强调了强化学习算法是如何在围棋、Dota 2和星际争霸2等游戏中击败专业人士的。强化学习是一种机器学习,它使人工智能能够在电子游戏、机器人、自动驾驶汽车等复杂应用中得到应用。

如果您对在您的项目中使用强化学习技术感兴趣,但您以前从未使用过它,那么从哪里开始呢?

这本电子书将帮助你开始用MATLAB强化学习®和模拟万博1manbetx®通过解释术语和提供对示例、教程和试用软件的访问。

下载此电子书以了解:

第1节:环境的基础和设置

了解加强学习的基础知识以及它与传统控制设计的比较。看看监督,无监督和强化学习之间的区别,看看如何在Matlab和Simulink中设置学习环境。万博1manbetx

第2节:奖励和政策结构

了解强化学习中的探索和开发,以及如何塑造奖励功能。探索不同的选择表示政策,包括神经网络,以及如何使用它们作为函数逼近器。

第3节:了解培训和部署

了解不同类型的培训算法,包括基于策略的值和基于价值的和批评者的方法。了解有关每种培训方法的优缺点以及流行的Bellman方程式的更多信息。最后,在部署培训的策略之前,请参阅您应该考虑的内容,以及与此技术相关的总体挑战和缺点。