选项设置为强化学习代理表示(批评家和演员)
rlValueRepresentation |
评论家表示值函数强化学习代理 |
rlQValueRepresentation |
强化学习代理核反应能量函数评论家表示 |
rlDeterministicActorRepresentation |
强化学习代理确定的演员表示 |
rlStochasticActorRepresentation |
强化学习代理随机演员表示 |