文档帮助中心
获得强化学习环境或代理观测数据规格
obsInfo = getObservationInfo(ENV)
obsInfo = getObservationInfo(剂)
例
obsInfo= getObservationInfo(ENV)从强化学习环境中提取的观测信息ENV。
obsInfo= getObservationInfo(ENV)
obsInfo
ENV
obsInfo= getObservationInfo(代理人)从强化学习代理提取观测信息代理人。
obsInfo= getObservationInfo(代理人)
代理人
全部收缩
提取的动作和观察的信息,你可以用它来创建其他环境或代理商。
这个例子的强化学习环境是自我汽车和引导车厢简单的纵向动态。培训目标是使自我汽车行驶在设定的速度,同时保持从引导车的安全距离,通过控制纵向加速度(和制动)。本例使用相同的车辆模型作为自适应巡航控制系统使用模型预测控制(模型预测控制工具箱)的例子。
打开模型并创建强化学习环境。
MDL ='rlACCMdl';open_system(MDL);agentblk = [MDL'/ RL代理']。%创建的观测信息obsInfo = rlNumericSpec([3 1],“假定下限”,-INF *也是(3,1),'UpperLimit用户',INF *也是(3,1));obsInfo.Name =“意见”;obsInfo.Description =“上速度误差信息和自我速度”;%的行动信息actInfo = rlNumericSpec([1 1],“假定下限”,-3,'UpperLimit用户',2);actInfo.Name =“加速度”;%定义环境ENV = rl万博1manbetxSimulinkEnv(MDL,agentblk,obsInfo,actInfo)
ENV = 万博1manbetxSimulinkEnvWithAgent具有属性:型号: “rlACCMdl” AgentBlock: “rlACCMdl / RL代理” ResetFcn:[] UseFastRestart: '接通'
加强学习环境ENV是万博1manbetxSimulinkWithAgent与上述属性对象。
万博1manbetxSimulinkWithAgent
摘自强化学习环境中的动作和观察信息ENV。
actInfoExt = getActionInfo(ENV)
actInfoExt = rlNumericSpec与属性:假定下限:-3 UpperLimit用户:2名称: “加速度” 描述:[为0x0字符串]尺寸:[1 1]数据类型: “双”
obsInfoExt = getObservationInfo(ENV)
obsInfoExt = rlNumericSpec与属性:假定下限:[3X1双] UpperLimit用户:[3X1双]名称: “观察” 描述: “上速度误差和自我速度信息” 尺寸:[3 1]数据类型: “双”
的动作信息中包含的加速度值而观察信息包含自身车辆的速度和速度误差值。
万博1manbetxSimulinkEnvWithAgent
强化学习环境从中观察信息具有要被提取,指定为万博1manbetxSimulinkEnvWithAgent宾语。
有关强化学习环境的详细信息,请参阅创建强化学习的万博1manbetxSimulink环境。
rlQAgent
rlSARSAAgent
rlDQNAgent
rlDDPGAgent
rlPGAgent
rlACAgent
强化学习剂从该观察信息具有要被提取,指定为下面的对象之一:
有关强化学习代理的详细信息,请参阅强化学习代理。
rlNumericSpec
rlFiniteSetSpec
观测数据规格从强化学习环境萃取,返回作为下列之一的数组:
rlNumericSpec对象
rlFiniteSetSpec对象
的混合rlNumericSpec和rlFiniteSetSpec对象
getActionInfo|rlACAgent|rlDDPGAgent|rlDQNAgent|rlFiniteSetSpec|rlNumericSpec|rlPGAgent|rlQAgent|rlSARSAAgent
getActionInfo
这个例子的修改版本的系统上存在。你要打开这个版本呢?
您单击对应于该MATLAB命令的链接:
在MATLAB命令窗口中输入它运行的命令。Web浏览器不支持MATLAB的命令。万博1manbetx
选择一个网站,以获得翻译的内容,其中可看到当地的活动和优惠。根据您的位置,我们建议您选择:。
您还可以选择从下面的列表中的网站:
选择最佳的网站性能的中国网站(在中国或英文)。其他MathWorks的国家网站都没有从您的位置访问进行了优化。
请联系您当地的办事处
现在就试用