万博1manbetx环境
使用Simulink模型增强学习环境动态万博1manbetx®楷模
在强化学习方案中,环境对代理相互作用的动力学建模。环境:
收到代理商的行动
由环境模型的动态行为产生的观察结果
产生奖励,以衡量行动有助于完成任务的能力
您可以使用Simulink模型创建预定义和自定义环境。万博1manbetx有关更多信息,请参阅创建Simul万博1manbetxink增强学习环境。
功能
块
RL代理 | 强化学习代理 |
话题
- 创建Simul万博1manbetxink增强学习环境
使用Simulink模型与代理相互作用,生成奖励和观察结果,以响应代理万博1manbetx操作。
- 为增强学习设计万博1manbetx师创建模拟环境
导入自定义模拟环境或创建预定义的万博1manbetxSimulink环境。
- 定义奖励信号
创建一个奖励信号,以衡量代理商在实现其目标方面的成功。
- 加载预定义的Simulink环境万博1manbetx
加载预定义的Simulink控制万博1manbetx系统环境。
- 水箱加固学习环境模型
创造a reinforcement learning Simulink environment that contains an RL Agent block in place of a controller for the water level in a tank.