为什么不能输出最优解,验证代理商吗?
12个视图(30天)
显示旧的评论
大家好,
主题:强化学习,DQN代理。
我已经训练一个代理数据集(共28个训练数据),那么所有这些数据进行验证。问题是我不能得到最优结果验证。他们中的一些人是好的但不是每个结果很好。
- env:我custermized环境。
- 我用这个函数创建批评:评论家= rlVectorQValueFunction (nn、obsInfo actInfo);
- 与创建一个批评家dqn代理:代理= rlDQNAgent(批评);
我有尝试新代理只有1的数据。培训可以聚集。这个数据也验证了正确答案。但我训练有素的代理使用相同的hyperparameter 28所有数据。....正确性不是garanteed波折我不知道是什么原因。因为数据集太小?或者我给错hyperparameter ?
Hyperparameter代理:
agent.AgentOptions.EpsilonGreedyExploration。EpsilonDecay = 0.9;
agent.AgentOptions.EpsilonGreedyExploration。ε= 0.9;
agent.AgentOptions.EpsilonGreedyExploration。EpsilonMin = 0.001;
agent.AgentOptions。DiscountFactor = 0.99;
agent.AgentOptions。MiniBatchSize = 128;
agent.AgentOptions.CriticOptimizerOptions。LearnRate = 0.0008;
agent.AgentOptions.CriticOptimizerOptions。GradientThreshold = 1;
agent.AgentOptions.SaveExperienceBufferWithAgent = true;
谢谢你!
库恩