rlqagentoptions.

Q-Learning Agent选项

描述

用A.rlqagentoptions.对象指定创建Q学习代理的选项。创建Q学习代理,使用rlqagent.

有关Q学习代理的更多信息,请参阅Q学习代理

有关不同类型的强化学习代理商的更多信息,请参阅加固学习代理人

创建

描述

选择= rlqagentoptions.创造一个rlqagentoptions.使用所有默认设置创建Q学习代理时用作参数的对象。您可以使用点表示法修改对象属性。

选择= rlqagentoptions(名称,价值设置选项特性使用名称值对。例如,RLQAgentOptions('贴花因子',0.95)创建一个选项设置,折扣系数0.95。您可以指定多个名称值对。将每个属性名称括在引号中。

特性

展开全部

epsilon贪婪探索的选项,指定为一个epsilongredyexpliation.对象具有以下数值属性。

财产 描述
埃斯利昂 随机选择一个动作或选择最大化状态动作值函数的动作的概率阈值。更大的价值埃斯利昂意味着代理程序以更高的速率随机探索动作空间。
epsilonmin 最小值埃斯利昂
epsilondecay 衰减率

埃斯利昂在大于时使用以下公式更新epsilonmin

epsilon = epsilon *(1-epsilondecay)

要指定探索选项,请在创建后使用点表示法rlqagentoptions.目的。例如,将概率阈值设置为0.9

选择= rlqagentoptions;opt.epsilongredyexpliation.epsilon = 0.9;

代理的采样时间,指定为正标量。

在培训期间应用于未来奖励的折扣因素,指定为小于或等于1的正标量。

对象功能

rlqagent. Q学习强化学习代理

例子

全部收缩

此示例显示如何为Q学习代理创建选项对象。

创建一个rlqagentoptions.指定代理采样时间的对象。

opt = rlqagentoptions('采样时间',0.5)
Opt =具有属性的RLQAGENTOPTIONS:epsilongredyexpliation:[1x1 Rl.Option.epsilongredyexpliation] SampleTime:0.5000折扣物:0.9900

您可以使用点表示法修改选项。例如,将代理折扣系数设置为0.95

opt.discountfactor = 0.95;

也可以看看

话题

在R2019A介绍