rlsarsaagent
SARSA加固学习代理
描述
SARSA算法是一种无模型的在线,式增强学习方法。SARSA代理人是一种基于价值的增强式学习代理商,培训评论家以估计回报或将来的回报。
有关SARSA代理商的更多信息,请参阅SARSA代理商。
有关不同类型的强化学习代理的更多信息,请参见强化学习代理。
特性
对象功能
火车 |
在指定环境中训练加固学习代理 |
SIM |
Simulate trained reinforcement learning agents within specified environment |
getAction |
Obtain action from agent or actor given environment observations |
getactor |
Get actor from reinforcement learning agent |
setActor |
加固学习代理人的演员 |
GetCritic |
从加强学习者那里获取评论家 |
setcritic |
设定加强学习者的批评家 |
生成PolicyFunction |
Create function that evaluates trained policy of reinforcement learning agent |