rlDeterministicActorPolicy
描述
这个对象实现了一个确定的政策,这将返回给定一个输入连续的确定性行为的观察。您可以创建一个rlDeterministicActorPolicy
对象从一个rlContinuousDeterministicActor
从一个或提取它rlDDPGAgent
或rlTD3Agent
。你可以训练策略对象使用自定义训练循环或将它部署您的应用程序使用generatePolicyBlock
或generatePolicyFunction
。这一政策总是确定性和不执行任何勘探。有关政策和价值函数的更多信息,请参阅创建政策和价值功能。
创建
描述
创建策略对象确定的演员政策
= rlDeterministicActorPolicy (演员
)政策
从连续确定的演员演员
。它还设置了演员
的属性政策
的输入参数演员
。
属性
对象的功能
generatePolicyBlock |
生成万博1manbetx块,评估一个代理的政策或政策对象 |
generatePolicyFunction |
生成MATLAB函数,评价代理人的政策或政策对象 |
getAction |
从代理,获得动作演员,或政策对象环境的观察 |
getLearnableParameters |
从代理,获得可学的参数值函数近似者,或政策对象 |
重置 |
重置环境、代理经验缓冲区,或政策对象 |
setLearnableParameters |
设置代理可学的参数值,函数近似者,或政策对象 |
例子
版本历史
介绍了R2022a