主要内容

检查培训

上一次培训课程的绘图培训信息

    描述

    默认情况下,火车功能显示了培训期间的培训进度和成果经理的结果。如果您配置培训以不显示情节经理或在培训后关闭情节经理,则可以使用该培训结果查看培训结果检查培训function, which opens the Episode Manager. You can also use检查培训查看培训期间保存的代理商的培训结果。

    例子

    检查培养物(火车冲突打开情节经理,并绘制先前培训课程的培训结果。

    例子

    检查培养物(代理商打开情节经理并绘制以前保存的代理结构的培训结果。

    例子

    全部收缩

    在此示例中,假设您已经训练了代理商MDP环境中的火车加固学习代理例子,subsequently closed the Episode Manager.

    加载培训信息由火车功能。

    加载mdptrainingstats训练stats

    重新开放本培训课程的情节经理。

    检查TrainingResult(训练Statts)

    在此示例中,加载环境和代理MDP环境中的火车加固学习代理例子。

    加载mdpagentandenvironment

    指定培训代理商的选项。配置SaveagentCriteriaandSaveagentValue第30集之后保存所有代理商的选项。

    trainopts = rltrainingoptions;trainopts.maxstepsperperepisode = 50;trainopts.maxepisodes = 50;trainopts.plots =“没有任何”;trainopts.saveagentCriteria ="EpisodeCount";trainopts.saveagentValue = 30;

    训练代理。在培训期间,当一集的奖励大于或等于13时,代理的副本保存在savedAgents文件夹。

    rng('default'%可再现性训练stats= train(qAgent,env,trainOpts);

    为一位节省的代理商加载训练结果。该命令同时加载代理和包含相应训练结果的结构。

    加载SAVEDAGENTS/AGENT50

    View the training results from the saved agent result structure.

    检查TrainingResult(SavedagentResult)

    情节经理展示了培训的进展到代理商保存的情节。

    输入参数

    全部收缩

    训练剧集数据,指定为由结构或结构阵列火车功能。

    保存的代理结果,指定为先前保存的结构火车功能。这火车指定函数会节省代理SaveagentCriteriaandSaveagentValue选项rltrainingoptions训练期间使用的对象。

    当您加载保存的代理时,代理及其训练结果将添加到MATLAB中®工作区为SAVED_AGENTandsavedAgentResultStruct, 分别。要绘制此代理的训练数据,请使用以下命令。

    检查培养物(savedAgentResultStruct)

    用于多机构培训,savedAgentResultStruct包含所有受过训练的代理的训练结果的结构场。

    版本历史记录

    在R2021a中引入

    也可以看看

    功能