深度Q网络强化学习agent
深度q -网络(DQN)算法是一种无模型、在线、非策略的强化学习方法。DQN代理是一种基于价值的强化学习代理,它训练批评者来估计回报或未来的回报。DQN是q学习的一种变体,它只在离散的动作空间内运行。
欲了解更多信息,深Q-Network代理.有关不同类型的强化学习代理的更多信息,请参见强化学习代理.
为具有给定的观察和操作规范的环境创建DQN代理。属性中指定的选项配置的默认网络代理人
=rlDQNAgent(观测信息
,行动信息
,initOpts
)initOpts
有关初始化选项的详细信息,请参阅rlagentinizationoptions
.
使用为DQN代理设置的默认选项,创建具有指定评论家网络的DQN代理。代理人
=rlDQNAgent(评论家
)
创建具有指定评论家网络的DQN代理,并设置代理人
=rlDQNAgent(评论家
,代理
)AgentOptions
财产归代理
输入参数。在前面语法中的任何输入参数之后使用此语法。