文件帮助中心文件
setlearnableparametervalues.
setlearnableparameters.
设置策略或value函数表示的学习参数值
newrep = setlearnableparameters(oldrep,val)
例子
newRep= setLearnableParameters (oldrep.那瓦)返回新的策略或value函数表示,newRep,其结构与原始表示法相同,oldrep.,以及指定的学习参数值瓦。
newRep= setLearnableParameters (oldrep.那瓦)
newRep
oldrep.
瓦
全部收缩
假设您拥有现有的培训钢筋学习代理。对于此示例,从培训的代理商加载火车DDPG代理控制双积分系统。
加载(“DoubleIntegDDPG.mat”那'代理人')
从代理人那里获得批评者。
评论家=克罗里特(代理人);
从评论家获取学习参数。
Params = GetLearnableParameters(评论家);
修改参数值。对于此示例,简单地将所有参数乘以2。
2
ModifiedParams = Cellfun(@(x)x * 2,params,'统一输出'、假);
将批评的参数值设置为新的修改值。
评论家= setlearnableparameters(批评者,修改日明普);
将代理中的评论家设置为新修改的评论家。
代理= setcritic(代理商,批评者);
从代理获取参与者表示。
Actor = GetAttor(代理);
从行动者处获得可学习参数。
Params = GetLearnableParameters(演员);
将Actor的参数值设置为新的修改值。
Actor = SetLearnableParameters(演员,ModifiedParams);
将代理中的演员设置为新的修改演员。
代理= setActor(代理、演员);
rlvalueerepresentation
rlqvalueerepresentation
RLDETerminyActorRepresentation
rlStochasticActorRepresentation
原始策略或value函数表示,指定为以下之一:
rlvalueerepresentation对象 - 值函数表示
rlqvalueerepresentation对象 - Q值函数表示
RLDETerminyActorRepresentation对象 - 具有确定性行动的演员表示
rlStochasticActorRepresentation对象 - 带有随机行动的演员表示
要创建策略或值函数表示,请使用以下方法之一:
使用相应的表示对象创建表示。
从代理商使用中获取现有的值函数表示透镜
透镜
使用工作者。
工作者
表示对象的可学习参数值,指定为单元数组。参数in.瓦必须与结构和参数化兼容oldrep.。
要从现有表示获取从现有表示的学习参数值的单元格数组,然后可以修改,使用GetLearnableParameters.功能。
GetLearnableParameters.
新策略或value函数表示,返回为与相同类型的表示对象oldrep.。newRep具有相同的结构oldrep.但参数值来自瓦。
展开全部
R2020a行为改变
setlearnableparametervalues.就是现在setlearnableparameters.。要更新代码,请更改函数名称setlearnableparametervalues.至setlearnableparameters.。语法是等效的。
工作者|透镜|GetLearnableParameters.|setActor.|setcritic.
setActor.
setcritic.
您有此示例的修改版本。您是否希望使用您的编辑打开此示例?
您单击了与此MATLAB命令对应的链接:
在MATLAB命令窗口中输入它来运行命令。Web浏览器不支持MATLAB命令。万博1manbetx
选择一个网站,以便在可用的地方进行翻译的内容,并查看本地活动和优惠。根据您的位置,我们建议您选择:。
您还可以从以下列表中选择一个网站:
选择中国网站(以中文或英文)以获取最佳网站性能。其他MathWorks国家网站未优化您的位置。
联系您当地的办公室