深度q -网络强化学习代理
深度q -网络(DQN)算法是一种无模型、在线、非策略的强化学习方法。DQN代理是一种基于价值的强化学习代理,它训练批评者来估计回报或未来的回报。DQN是q学习的一种变体,它只在离散的动作空间内运行。
有关更多信息,深Q-Network代理.有关不同类型的强化学习代理的更多信息,请参见强化学习代理.
使用默认初始化选项,为具有给定观察和操作规范的环境创建DQN代理。agent中的批判表示使用了一个由观测规范构建的默认多输出q值深度神经网络代理
= rlDQNAgent (observationInfo
,actionInfo
)observationInfo
以及动作规范actionInfo
.
为具有给定的观察和操作规范的环境创建DQN代理。属性中指定的选项配置的默认网络代理
= rlDQNAgent (observationInfo
,actionInfo
,initOpts
)initOpts
对象。有关初始化选项的更多信息,请参见rlAgentInitializationOptions
.
使用为DQN代理设置的默认选项,创建具有指定评论家网络的DQN代理。代理
= rlDQNAgent (评论家
)
创建具有指定评论家网络的DQN代理,并设置代理
= rlDQNAgent (评论家
,agentOptions
)AgentOptions
财产agentOptions
输入参数。在前面语法中的任何输入参数之后使用此语法。