为强化学习代理表示(批评者和参与者)设置的选项
rlvalueerepresentation |
强化学习主体的价值函数批判表示 |
rlqvalueerepresentation |
Q-Value Function评论家强化学习代理的代表 |
RLDETerminyActorRepresentation |
强化学习主体的确定性行为体表示 |
rlStochasticActorRepresentation |
强化学习智能体的随机角色表示 |