万博1manbetx环境
使用Simulink建模强化学习环境动力学万博1manbetx®模型
在强化学习场景中,环境对代理交互的动态进行建模。环境:
从代理接收操作
输出由环境模型的动态行为产生的观察结果
生成一个奖励来衡量行为对完成任务的贡献程度
您可以使用Simulink模型创建预定义的和定制的环境。万博1manbetx有关更多信息,请参见创建Simul万博1manbetxink强化学习环境.
功能
块
RL代理 | 强化学习剂 |
主题
- 创建Simul万博1manbetxink强化学习环境
使用与代理交互的Simulink模型建模环境动态,生成响应代理动作的奖万博1manbetx励和观察结果。
- 为强化学习设计万博1manbetx器创建Simulink环境
导入自定义Simulink环境或万博1manbetx创建预定义Simulink环境。
- 定义奖励信号
创造一个奖励信号来衡量代理在实现目标时的成功程度。
- 加载预定义的Simulink环境万博1manbetx
加载预定义的Simulink控制万博1manbetx系统环境。
- 水箱强化学习环境模型
创建一个强化学习Simulink环境,其中包含一个RL Agen万博1manbetxt块,以代替水箱中水位的控制器。