值表或Q表
值表和Q表是代表评论家网络的强化学习的一种方式。值表存储一组有限的观察奖励。Q表存储了相应的有限观察,动作对奖励。
一种使用创建一个值函数表示rlTable
对象,使用rlValueRepresentation
或rlQValueRepresentation
对象。
rlValueRepresentation |
为强化学习代理商的价值功能评论家表示 |
rlQValueRepresentation |
为强化学习代理的Q值函数评论家表示 |