主要内容

加固学习设计师

设计,火车和模拟强化学习代理

描述

加固学习设计师应用程序允许您设计,列车和模拟现有的强化学习环境的代理。

使用此应用程序,您可以:

  • 从MATLAB导入现有环境®工作区或创建预定义的环境。

  • 自动创建或导入环境的代理(DQN,DDPG,PPO和TD3代理)。万博1manbetx

  • 火车并模拟反对环境的代理人。

  • 分析模拟结果并优化您的代理参数。

  • 将最终代理导出到MATLAB工作区以进行进一步使用和部署。

限制

以下功能不支持以下功能万博1manbetx加固学习设计师应用程序。

  • 多种代理系统

  • Q,Sarsa,PG,AC和SAC代理

  • 自定义代理人

  • 代理依赖表或自定义基础函数表示

如果您的应用程序要求这些功能中的任何一个,则在命令行中设计,列车和模拟代理。

打开钢筋学习设计师应用程序

  • MATLAB TOOLSTRIP:在应用标签,下面机器学习和深度学习,单击“应用”图标。

  • matlab命令提示符:输入钢筋训练器

程序使用

展开全部

钢筋训练器打开加固学习设计师应用程序。然后,您可以导入环境并开始设计过程,或打开已保存的设计会话。

在R2021A介绍