帮助中心帮助中心
创建强化学习数据规范的元素万博1manbetx公共汽车
自从R2019a
规格= bus2RLSpec (busName)
规格= bus2RLSpec (busName、名称、值)
例子
规格= bus2RLSpec (busName)创建一套强化学习规范的数据模型万博1manbetx®总线所指定的对象busName。一个规范元素为每片叶子元素创建相应的仿真软件总线。万博1manbetx使用这些规范来定义操作和观测模型强化学习环境。万博1manbetx
规格
busName
规格= bus2RLSpec (busName,名称,值)使用一个或多个指定选项创建规范名称,值对参数。
规格= bus2RLSpec (busName,名称,值)
名称,值
全部折叠
这个例子展示了如何使用函数bus2RLSpec从仿真软件创建一个观测规范对象®总线对象。万博1manbetx
bus2RLSpec
创建一个总线对象。
obsBus = 万博1manbetxSimulink.Bus ();
创建总线和三个元素指定他们的名字。
obsBus.Elements (1) =万博1manbetx Simulink.BusElement;obsBus.Elements (1)。Name =“sin_theta”;obsBus.Elements (2) =万博1manbetx Simulink.BusElement;obsBus.Elements (2)。Name =“cos_theta”;obsBus.Elements (3) =万博1manbetx Simulink.BusElement;obsBus.Elements (3)。Name =“dtheta”;
使用仿真软件总线创建观测规范对象的对象。万博1manbetx
obsInfo = bus2RLSpec (“obsBus”);
然后,您可以使用obsInfo与相应的仿真软件模型,创建一个强化的学习环境。万博1manbetx例如,看到的火车DDPG代理摇摆起来,平衡摆与总线信号。
obsInfo
这个例子显示了如何调用这个函数bus2RLSpec使用名称和值对创建一个操作规范对象从一个仿真软件®总线对象。万博1manbetx
actBus = 万博1manbetxSimulink.Bus ();
在总线和创建一个元素指定的名字。
actBus.Elements (1) =万博1manbetx Simulink.BusElement;actBus.Elements (1)。Name =“执行机构”;
actInfo = bus2RLSpec (“actBus”,“DiscreteElements”,{“执行机构”[1]});
这指定“执行机构”巴士元素可以携带两个可能的值,1,1。
1
然后,您可以使用actInfo与相应的仿真软件模型,创建一个强化的学习环境。万博1manbetx具体的函数创建环境使用actInfo确定正确的代理总线输出块。
actInfo
例如,看到的火车DDPG代理摇摆起来,平衡摆与总线信号。
仿真软件总线对象万博1manbetx的名称,指定为字符串或字符向量。
指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。
Name1 = Value1,…,以=家
的名字
价值
R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。
例子:DiscreteElements,{‘力’,(5 0 5)}设置“力”公共汽车元素是一个离散数据规范有三个可能的值,5,0,5
DiscreteElements,{‘力’,(5 0 5)}
“力”
5
0
模型
仿真软件模型,名称指定为万博1manbetx逗号分隔组成的“模型”和一个字符串或字符向量。指定模式名当总线对象模型中定义全局工作空间(例如,在数据字典)而不是MATLAB®工作区。
“模型”
BusElementNames
总线的名字叶子元素创建规范,指定为逗号分隔组成的“BusElementNames”和一个字符串数组。创建观测规范的一个子集元素在仿真软件总线对象,指定万博1manbetxBusElementNames。如果你不指定BusElementNames,创建一个数据规范在公共汽车上为每个叶子元素。
“BusElementNames”
请注意
没有指定BusElementNames当创建规范行动的信号。的RL代理块必须输出完整的总线信号。
DiscreteElements
有限值离散汽车元素,指定为逗号分隔组成的“DiscreteElements”和一个单元阵列名称-值对。每一个名称-值对由一个总线叶元素名称和离散值的数组。指定的离散值必须到指定的数据类型浆料行动信号。
“DiscreteElements”
如果不指定规范离散值的元素,该元素是连续的。
例子:ActionDiscretElements,{‘力’,(-10 0),“扭矩”,(5 0 5)}指定的离散值“力”和“扭矩”叶元素总线操作信号。
ActionDiscretElements,{‘力’,(-10 0),“扭矩”,(5 0 5)}
“扭矩”
rlNumericSpec
rlFiniteSetSpec
数据为强化学习的行为规范或观察,返回以下之一:
rlNumericSpec对象为单个连续总线元素
rlFiniteSetSpec为一个离散总线元素对象
数据为多个总线规范对象元素的数组
默认情况下,所有的数据规范汽车元素rlNumericSpec对象。创建一个离散的规范对一个或多个公共汽车元素,指定元素名称使用DiscreteElements名称-值对。
介绍了R2019a
rl万博1manbetxSimulinkEnv
createIntegratedEnv
你有一个修改版的这个例子。你想打开这个例子与编辑?
你点击一个链接对应MATLAB命令:
运行该命令通过输入MATLAB命令窗口。Web浏览器不支持MATLAB命令。万博1manbetx
选择一个网站
选择一个网站翻译内容,看到当地事件和提供。根据你的位置,我们建议您选择:。
你也可以从下面的列表中选择一个网站:
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。
联系你当地的办公室