最近的新闻报道强调了强化学习算法如何在GO、Dota 2和星际争霸2等游戏中击败专业人士。强化学习是一种机器学习,能够在从视频游戏到机器人、自动驾驶汽车等复杂应用中使用人工智能。

如果您对在项目中使用强化学习技术感兴趣,但以前从未使用过,那么您从哪里开始?

这本电子书将帮助你在MATLAB中开始强化学习®和仿真软万博1manbetx件®通过解释术语并提供示例、教程和试用软件。

阅读本电子书了解:

第1节:了解基本知识和设置环境
学习强化学习的基础知识,以及它与传统控制设计的比较。了解有监督学习、无监督学习和强化学习之间的区别,并了解如何在MATLAB和Simulink中设置学习环境。万博1manbetx

第二部分:理解奖励和政策结构
了解强化学习中的探索和开发以及如何形成奖励函数。探索表示策略的不同选项,包括神经网络,以及如何将它们用作函数近似器。

第三部分:理解培训和部署
了解不同类型的培训算法,包括基于策略的、基于价值的和演员批评方法。了解每种训练方法的优缺点以及流行的贝尔曼方程。最后,在部署一个经过训练的策略之前,您应该考虑什么,以及与此技术相关联的总体挑战和缺点。

30天免费试用

尝试MATLAB, Si万博1manbetxmulink等等。

开始