文档帮助中心
从强化学习环境或代理获取观察数据规范
obsInfo=getObservationInfo(环境)
obsInfo=getObservationInfo(代理)
实例
obsInfo=getObservationInfo(环境)从强化学习环境中提取观察信息环境.
obsInfo=getObservationInfo(环境)
obsInfo
环境
obsInfo=getObservationInfo(代理人)从强化学习代理中提取观察信息代理人.
obsInfo=getObservationInfo(代理人)
代理人
全部崩溃
提取可用于创建其他环境或代理的操作和观察信息。
本示例中的强化学习环境是ego car和lead car的简单纵向动力学。培训目标是通过控制纵向加速度(和制动),使ego car以设定速度行驶,同时保持与lead car的安全距离。本示例使用与基于模型预测控制的自适应巡航控制系统(模型预测控制工具箱)实例
打开模型并创建强化学习环境。
mdl=“rlACCMdl”; 开放式系统(mdl);agentblk=[mdl“/RL代理”];%创建观察信息obsInfo=rlNumericSpec([3 1],“LowerLimit”,-inf*one(3,1),“上限”,inf*one(3,1));obsInfo.Name=“观察”; obsInfo.Description=“速度误差和速度信息”;%行动信息actInfo=rlNumericSpec([1],“LowerLimit”,-3,“上限”,2); actInfo.Name=“加速”;%定义环境env=rlSi万博1manbetxmulinkEnv(mdl、agentblk、obsInfo、actInfo)
env=Si万博1manbetxmulinkEnvWithAgent,属性为:模型:rlACCMdl AgentBlock:rlACCMdl/RL Agent ResetFcn:[]使用快速重启:打开
强化学习环境环境是一个万博1manbetx模拟代理具有上述属性的对象。
万博1manbetx模拟代理
从强化学习环境中提取行动和观察信息环境.
actInfoExt=getActionInfo(环境)
ActionFoText=rlNumericSpec,属性:LowerLimit:-3上限:2名称:“加速度”说明:[0x0字符串]维度:[1]数据类型:“双”
obsInfoExt=getObservationInfo(env)
obsInfoExt=rlNumericSpec,属性为:LowerLimit:[3x1 double]上限:[3x1 double]名称:“观测值”说明:“速度误差和自我速度信息”维度:[3 1]数据类型:“double”
动作信息包含加速度值,而观察信息包含车辆的速度和速度误差值。
万博1manbetx与代理同步
强化学习环境,必须从中提取观察信息,指定为万博1manbetx与代理同步对象
有关强化学习环境的更多信息,请参阅为强化学习创建万博1manbetxSimulink环境.
rlQAgent
萨金特
rlDQNAgent
RLDDPG试剂
rlPGAgent
拉卡金特
必须从中提取观察信息的强化学习代理,指定为以下对象之一:
有关强化学习代理的更多信息,请参阅强化学习代理.
rlNumericSpec
rlFiniteSetSpec
从强化学习环境中提取的观察数据规范,作为以下内容之一的数组返回:
rlNumericSpec物体
rlFiniteSetSpec物体
混合rlNumericSpec和rlFiniteSetSpec物体
getActionInfo|拉卡金特|RLDDPG试剂|rlDQNAgent|rlFiniteSetSpec|rlNumericSpec|rlPGAgent|rlQAgent|萨金特
getActionInfo
您的系统上存在此示例的修改版本。是否改为打开此版本?
您单击了与此MATLAB命令对应的链接:
通过在MATLAB命令窗口中输入命令来运行该命令。Web浏览器不支持MATLAB命令。万博1manbetx
选择一个网站以获取翻译后的内容(如果可用),并查看本地活动和优惠。根据您的位置,我们建议您选择:.
您还可以从以下列表中选择网站:
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家/地区网站未针对您所在地的访问进行优化。
联系当地办事处
现在受审