setlearnableparameters.

设置策略或value函数表示的学习参数值

页面上倒塌

句法

newrep = setlearnableparameters（oldrep，val）

描述

例子

newRep= setLearnableParameters (oldrep.那瓦）返回新的策略或value函数表示，newRep，其结构与原始表示法相同，oldrep.，以及指定的学习参数值瓦。

例子

全部收缩

修改批评参数值

打开生活的脚本

假设您拥有现有的培训钢筋学习代理。对于此示例，从培训的代理商加载火车DDPG代理控制双积分系统。

加载（“DoubleIntegDDPG.mat”那'代理人'）

从代理人那里获得批评者。

评论家=克罗里特（代理人）;

从评论家获取学习参数。

Params = GetLearnableParameters（评论家）;

修改参数值。对于此示例，简单地将所有参数乘以2。

ModifiedParams = Cellfun（@（x）x * 2，params，'统一输出'、假);

将批评的参数值设置为新的修改值。

评论家= setlearnableparameters（批评者，修改日明普）;

将代理中的评论家设置为新修改的评论家。

代理= setcritic（代理商，批评者）;

修改Actor参数值

打开生活的脚本

假设您拥有现有的培训钢筋学习代理。对于此示例，从培训的代理商加载火车DDPG代理控制双积分系统。

加载（“DoubleIntegDDPG.mat”那'代理人'）

从代理获取参与者表示。

Actor = GetAttor（代理）;

从行动者处获得可学习参数。

Params = GetLearnableParameters（演员）;

修改参数值。对于此示例，简单地将所有参数乘以2。

ModifiedParams = Cellfun（@（x）x * 2，params，'统一输出'、假);

将Actor的参数值设置为新的修改值。

Actor = SetLearnableParameters（演员，ModifiedParams）;

将代理中的演员设置为新的修改演员。

代理= setActor(代理、演员);

输入参数

全部收缩

`oldrep.`-原始策略或价值函数表示
`rlvalueerepresentation`目的|`rlqvalueerepresentation`目的|`RLDETerminyActorRepresentation`目的|`rlStochasticActorRepresentation`目的

原始策略或value函数表示，指定为以下之一：

rlvalueerepresentation对象 - 值函数表示
rlqvalueerepresentation对象 - Q值函数表示
RLDETerminyActorRepresentation对象 - 具有确定性行动的演员表示
rlStochasticActorRepresentation对象 - 带有随机行动的演员表示

要创建策略或值函数表示，请使用以下方法之一:

使用相应的表示对象创建表示。
从代理商使用中获取现有的值函数表示透镜
使用工作者。

`瓦`-学习参数值
单元阵列

表示对象的可学习参数值，指定为单元数组。参数in.瓦必须与结构和参数化兼容oldrep.。

要从现有表示获取从现有表示的学习参数值的单元格数组，然后可以修改，使用GetLearnableParameters.功能。

输出参数

全部收缩

`newRep`- 新的策略或价值函数表示
`rlvalueerepresentation`|`rlqvalueerepresentation`|`RLDETerminyActorRepresentation`|`rlStochasticActorRepresentation`

新策略或value函数表示，返回为与相同类型的表示对象oldrep.。newRep具有相同的结构oldrep.但参数值来自瓦。

兼容性的考虑

展开全部

`setlearnableparametervalues.`就是现在`setlearnableparameters.`

R2020a行为改变

setlearnableparametervalues.就是现在setlearnableparameters.。要更新代码，请更改函数名称setlearnableparametervalues.至setlearnableparameters.。语法是等效的。

也可以看看

工作者|透镜|GetLearnableParameters.|setActor.|setcritic.

话题

在R2019A介绍

强化学习工具箱文档

万博1manbetx

用Matlab和Simulink加强学习万博1manbetx

下载电子书

setlearnableparameters.

句法

描述

例子

修改批评参数值

修改Actor参数值

输入参数

oldrep.-原始策略或价值函数表示rlvalueerepresentation目的|rlqvalueerepresentation目的|RLDETerminyActorRepresentation目的|rlStochasticActorRepresentation目的

瓦-学习参数值单元阵列

输出参数

newRep- 新的策略或价值函数表示rlvalueerepresentation|rlqvalueerepresentation|RLDETerminyActorRepresentation|rlStochasticActorRepresentation

兼容性的考虑

setlearnableparametervalues.就是现在setlearnableparameters.

也可以看看

话题

强化学习工具箱文档

万博1manbetx

用Matlab和Simulink加强学习万博1manbetx

`oldrep.`-原始策略或价值函数表示
`rlvalueerepresentation`目的|`rlqvalueerepresentation`目的|`RLDETerminyActorRepresentation`目的|`rlStochasticActorRepresentation`目的

`瓦`-学习参数值
单元阵列

`newRep`- 新的策略或价值函数表示
`rlvalueerepresentation`|`rlqvalueerepresentation`|`RLDETerminyActorRepresentation`|`rlStochasticActorRepresentation`

`setlearnableparametervalues.`就是现在`setlearnableparameters.`