MATLAB的答案

试用软件

DDPG代理停止训练

11次观看(过去30天)

显示旧的评论

al - rahman Al-Remal Abd 2021年6月14日

0

评论道: al - rahman Al-Remal Abd2021年7月1日

你好,

当训练我的RL代理时，由于某些原因，它在大约100集(通常更少)后停止训练，我设置的限制通常更少。我怀疑训练是否因为我的simulink模型中的“isdone”信号而停止了(除非在仅仅100集之后，它成功地得到了我指定的内容?)万博1manbetx

任何帮助或建议将不胜感激!

编辑:当我写这篇文章的时候，我意识到我的“isdone”信号的一部分是为了让我的模型的输出恰好是一个值——这可能是它获得一个值然后停止的原因吗?

2的评论
显示隐藏 1年长的评论

al - rahman Al-Remal Abd 2021年7月1日

是的，这就是问题所在——现在都解决了!：）

登录发表评论。

登录来回答这个问题。

答案(0)

登录来回答这个问题。

类别

人工智能，数据科学和统计学强化学习工具箱培训和验证

标签

s manbetx 845

释放

R2021a

社区寻宝

在MATLAB中央找到宝藏，并发现社区可以如何帮助你!

开始狩猎!

试用软件