文件帮助中心文件
设计,火车和模拟强化学习代理
这加固学习设计师应用程序允许您设计,列车和模拟现有的强化学习环境的代理。
使用此应用程序,您可以:
从MATLAB导入现有环境®工作区或创建预定义的环境。
自动创建或导入环境的代理(DQN,DDPG,PPO和TD3代理)。万博1manbetx
火车并模拟反对环境的代理人。
分析模拟结果并优化您的代理参数。
将最终代理导出到MATLAB工作区以进行进一步使用和部署。
以下功能不支持以下功能万博1manbetx加固学习设计师应用程序。
多种代理系统
Q,Sarsa,PG,AC和SAC代理
自定义代理人
代理依赖表或自定义基础函数表示
如果您的应用程序要求这些功能中的任何一个,则在命令行中设计,列车和模拟代理。
MATLAB TOOLSTRIP:在应用标签,下面机器学习和深度学习,单击“应用”图标。
matlab命令提示符:输入钢筋训练器。
钢筋训练器
展开全部
钢筋训练器打开加固学习设计师应用程序。然后,您可以导入环境并开始设计过程,或打开已保存的设计会话。
分析
rlddpgagent.
rldqnagent.
rlppoagent.
rltd3agent.
您单击了与此MATLAB命令对应的链接:
在MATLAB命令窗口中输入它来运行命令。Web浏览器不支持MATLAB命令。万博1manbetx
选择一个网站,以便在可用的地方进行翻译的内容,并查看本地活动和优惠。根据您的位置,我们建议您选择:。
您还可以从以下列表中选择一个网站:
选择中国网站(以中文或英文)以获取最佳网站性能。其他MathWorks国家网站未优化您的位置。
联系您当地的办公室