rlqagentoptions.

Q-Learning Agent选项

展开所有页面

描述

用A.rlqagentoptions.对象指定创建Q学习代理的选项。创建Q学习代理，使用rlqagent.

有关Q学习代理的更多信息，请参阅Q学习代理。

有关不同类型的强化学习代理商的更多信息，请参阅加固学习代理人。

创建

句法

opt = rlqagentoptions.

opt = rlqagentoptions（名称，值）

描述

选择= rlqagentoptions.创造一个rlqagentoptions.使用所有默认设置创建Q学习代理时用作参数的对象。您可以使用点表示法修改对象属性。

选择= rlqagentoptions（名称，价值）设置选项特性使用名称值对。例如，RLQAgentOptions（'贴花因子'，0.95）创建一个选项设置，折扣系数0.95。您可以指定多个名称值对。将每个属性名称括在引号中。

特性

展开全部

`epsilongredyexpliation.`-epsilon贪婪探索的选择
`epsilongredyexpliation.`目的

epsilon贪婪探索的选项，指定为一个epsilongredyexpliation.对象具有以下数值属性。

财产	描述
`埃斯利昂`	随机选择一个动作或选择最大化状态动作值函数的动作的概率阈值。更大的价值`埃斯利昂`意味着代理程序以更高的速率随机探索动作空间。
`epsilonmin`	最小值`埃斯利昂`
`epsilondecay`	衰减率

埃斯利昂在大于时使用以下公式更新epsilonmin：

epsilon = epsilon *（1-epsilondecay）

要指定探索选项，请在创建后使用点表示法rlqagentoptions.目的。例如，将概率阈值设置为0.9。

选择= rlqagentoptions;opt.epsilongredyexpliation.epsilon = 0.9;

`采样时间`-代理的采样时间
`1`（默认）|正标量

代理的采样时间，指定为正标量。

`贴纸物`-折扣系数
`0.99`（默认）|正标量小于或等于1

在培训期间应用于未来奖励的折扣因素，指定为小于或等于1的正标量。

对象功能

rlqagent. Q学习强化学习代理

例子

全部收缩

创建Q学习代理选项对象

打开直播脚本

此示例显示如何为Q学习代理创建选项对象。

创建一个rlqagentoptions.指定代理采样时间的对象。

opt = rlqagentoptions（'采样时间'，0.5）

Opt =具有属性的RLQAGENTOPTIONS：epsilongredyexpliation：[1x1 Rl.Option.epsilongredyexpliation] SampleTime：0.5000折扣物：0.9900

您可以使用点表示法修改选项。例如，将代理折扣系数设置为0.95。

opt.discountfactor = 0.95;

也可以看看

话题

Q学习代理

在R2019A介绍

强化学习工具箱文档

万博1manbetx

尝试matlab，sim万博1manbetxulink等产品s manbetx 845

立即获得审判