RlagentInitializatizationAptions

初始化强化学习代理的选项

在页面中扩展全部

描述

使用RlagentInitializatizationAptions对象为代理指定初始化选项。要创建代理，请使用特定的代理创建功能，例如rlacagent。

创建

句法

initopts = rlagentInitializationAptions

initopts = rlagentInitializatizatizAptions（名称，值）

描述

initopts= ragentInitializationAptions返回一个默认选项对象，以初始化支持默认网络的强化学习代理。万博1manbetx使用初始化选项来指定代理初始化参数，例如代理网络的每个隐藏层的单元数以及是否使用复发性神经网络。

例子

initopts= rlagentinitializationAptions（名称，价值）创建一个初始化选项对象并设置其特性通过使用一个或多个名称值对参数。

特性

展开全部

`numhidendunit`-每个隐藏的完全连接层中的单元数量
`256`（默认）|正整数

除了在网络输出之前的完全连接的层（指定为正整数）之前，代理网络的每个隐藏完全连接的层中的单元数量。您设置的值也适用于任何LSTM层。

例子：'numhidendunit'，64

`Usernn`-使用复发性神经网络的标志
`错误的`（默认）|`真的`

标志使用复发性神经网络，指定为逻辑。

如果您设置Usernn至真的，在代理创建过程中，软件将插入一个复发的LSTM层，其输出模式设置为在代理网络的输出路径中序列。政策梯度和参与者 - 批评者不支持复发性神经网络。万博1manbetx有关LSTM的更多信息，请参阅长期短期存储网络。

例子：'usernn'，是真的

对象功能

`rlacagent`	演员批判性强化学习者
`rlpgagent`	政策梯度加强学习代理
`rlddpgagent`	深层确定性政策梯度强化学习代理
`rldqnagent`	深Q网络加固学习代理
`rlppoagent`	近端政策优化强化学习代理
`rltd3agent`	双胞胎延迟的深层确定性政策梯度加强学习代理
`rlsAcagent`	软演员批判性的增强剂
`rltrpoagent`	信任区域政策优化强化学习代理

例子

全部收缩

创建代理初始化选项对象

打开实时脚本

创建代理初始化选项对象，指定隐藏神经元的数量并使用复发性神经网络。

initopts = rlagentInitializationAptions（'numhidendunit'，64，'usernn'，真的）

initopts =带有属性的rlagentInitializationAptions：numhidendunit：64 usernn：1

您可以使用点表示法修改选项。例如，将代理样本时间设置为0.5。

initopts.numhidendunit = 128

initopts =带有属性的rlagentInitializatizatizAptions：numhidendunit：128 usernn：1

版本历史记录

在R2020b中引入

也可以看看

getActioninfo|GetObservationinfo

话题

强化学习者