从系列中:2019年MATLAB油气大会
强化学习允许您在不使用标记数据的情况下使用深度学习解决控制问题。相反,它使用系统的模型来捕获环境的适当动态,并通过执行多个模拟来学习。这些模拟数据用于训练策略,通常由深度神经网络表示,然后取代传统的控制器或决策系统。
在本次演讲中,您将学习如何使用Reinforcement Learning Toolbox™和其他MathWorks产品来设置环境模型、定义策略及其各种超参数,并通过并行计算扩展训练以s manbetx 845提高性能。
您也可以从以下列表中选择一个网站:
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。