培训DDPG用于自适应巡航控制的代理 - Matlab＆Simulink - MathworksEspañ万博1manbetxa<GydF4y2Ba/title> <link href="//www.tianjin-qmedu.com/es/includes_content/responsive/css/bootstrap/bootstrap.min.css" rel="stylesheet" type="text/css"> <link href="//www.tianjin-qmedu.com/es/includes_content/responsive/css/site6.css?202109" rel="stylesheet" type="text/css"> <link href="//www.tianjin-qmedu.com/es/includes_content/responsive/css/site6_lg.css?202109" rel="stylesheet" media="screen and (min-width: 1200px)"> <link href="//www.tianjin-qmedu.com/es/includes_content/responsive/css/site6_md.css?202109" rel="stylesheet" media="screen and (min-width: 992px) and (max-width: 1199px)"> <link href="//www.tianjin-qmedu.com/es/includes_content/responsive/css/site6_sm+xs.css?202109" rel="stylesheet" media="screen and (max-width: 991px)"> <link href="//www.tianjin-qmedu.com/es/includes_content/responsive/css/site6_sm.css?202109" rel="stylesheet" media="screen and (min-width: 768px) and (max-width: 991px)"> <link href="//www.tianjin-qmedu.com/es/includes_content/responsive/css/site6_xs.css?202109" rel="stylesheet" media="screen and (max-width: 767px)"> <link href="//www.tianjin-qmedu.com/es/includes_content/responsive/css/site6_offcanvas_v2.css?202109" rel="stylesheet" type="text/css"> <link href="//www.tianjin-qmedu.com/es/includes_content/responsive/css/site7_crux.css?202109" rel="stylesheet" type="text/css"> <link href="//www.tianjin-qmedu.com/es/includes_content/responsive/css/localized/site6_es.css" rel="stylesheet" type="text/css"> <link href="//www.tianjin-qmedu.com/es/includes_content/releases/R2021b/css/doc_center.css?202109" rel="stylesheet" type="text/css"> <link href="//www.tianjin-qmedu.com/es/includes_content/releases/R2021b/css/doc_center_print.css?202109" rel="stylesheet" type="text/css" media="print"> <link href="//www.tianjin-qmedu.com/es/includes_content/releases/R2021b/css/doc_center_es.css?202109" rel="stylesheet" type="text/css"> <style> .examples_short_list a.btn {display: none;} </style> <style> .typeahead_container.typeahead_type_grouped { margin-left:0; } @media (min-width:768px) { #suggestions { margin-left:-100px } } </style> </head> <body id="responsive_offcanvas"> <a class="skip_link sr-only" href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#content_container">跳到内容<GydF4y2Ba/a>  <div class="header visible-xs visible-sm" id="header_mobile" translate="no"> <nav class="navbar navbar-default" role="navigation"> <div class="navbar-header"> <div class="container-fluid"> <div class="row"> <div class="col-xs-3"> <button type="button" class="navbar-toggle topnav_toggle" data-toggle="collapse" data-target="#topnav_collapse"><span class="sr-only">切换主导航<GydF4y2Ba/span><span class="icon-menu"></span></button> </div> <div class="col-xs-6"> <div class="text-center"> <a href="//www.tianjin-qmedu.com/es/?s_tid=gn_logo" class="svg_link navbar-brand"><img src="//www.tianjin-qmedu.com/es/images/responsive/global/pic-header-mathworks-logo.svg" class="mw_logo" alt="Mathworks.GydF4y2Ba"></a> </div> </div> <div class="col-xs-3"> <div class="matrix_affordance_container_mobile" id="matrix_affordance_container_mobile"></div> </div> </div> </div> </div> <div class="container-fluid"> <div class="row visible-xs visible-sm"> <div class="col-xs-12"> <div class="navbar-collapse collapse" id="topnav_collapse"> <ul class="nav navbar-nav" id="topnav"> <li class="topnav_products "><a href="//www.tianjin-qmedu.com/es/products.html?s_tid=gn_ps">Productos.<GydF4y2Ba/a></li> <li class="topnav_solutions "><a href="//www.tianjin-qmedu.com/es/solutions.html?s_tid=gn_sol">披露<GydF4y2Ba/a></li> <li class="topnav_academia "><a href="//www.tianjin-qmedu.com/es/academia.html?s_tid=gn_acad">Equación.<GydF4y2Ba/a></li> <li class="topnav_support "><a href="//www.tianjin-qmedu.com/es/support.html?s_tid=gn_supp">索波特<GydF4y2Ba/a></li> <li class="topnav_community "><a href="//www.tianjin-qmedu.com/es/matlabcentral/?s_tid=gn_mlc">Comunidad<GydF4y2Ba/a></li> <li class="topnav_events "><a href="//www.tianjin-qmedu.com/es/company/events.html?s_tid=gn_ev">事件<GydF4y2Ba/a></li> <li class="headernav_store"><a href="//www.tianjin-qmedu.com/es/products/get-matlab.html?s_tid=gn_getml">Consiga Matlab.<GydF4y2Ba/a></li> </ul> </div> <div class="navbar-collapse collapse" id="matrix_collapse"> <div class="matrix_menu_container_mobile" id="matrix_menu_container_mobile"></div> </div> </div> </div> </div> </nav> </div>   <div class="header hidden-xs hidden-sm" id="header_desktop" translate="no"> <nav class="navbar navbar-default" role="navigation"> <div class="container-fluid"> <div class="row"> <div class="col-md-9"> <div class="navbar-header"> <div class="logo_container hidden-xs hidden-sm"> <a href="//www.tianjin-qmedu.com/es/?s_tid=gn_logo" class="svg_link pull-left"><img src="//www.tianjin-qmedu.com/es/images/responsive/global/pic-header-mathworks-logo.svg" class="mw_logo" alt="Mathworks.GydF4y2Ba"></a> </div> <div class="navbar-collapse collapse hidden-xs hidden-sm"> <ul class="nav navbar-nav" id="topnav"> <li class="topnav_products "><a href="//www.tianjin-qmedu.com/es/products.html?s_tid=gn_ps">Productos.<GydF4y2Ba/a></li> <li class="topnav_solutions "><a href="//www.tianjin-qmedu.com/es/solutions.html?s_tid=gn_sol">披露<GydF4y2Ba/a></li> <li class="topnav_academia "><a href="//www.tianjin-qmedu.com/es/academia.html?s_tid=gn_acad">Equación.<GydF4y2Ba/a></li> <li class="topnav_support "><a href="//www.tianjin-qmedu.com/es/support.html?s_tid=gn_supp">索波特<GydF4y2Ba/a></li> <li class="topnav_community "><a href="//www.tianjin-qmedu.com/es/matlabcentral/?s_tid=gn_mlc">Comunidad<GydF4y2Ba/a></li> <li class="topnav_events "><a href="//www.tianjin-qmedu.com/es/company/events.html?s_tid=gn_ev">事件<GydF4y2Ba/a></li> </ul> </div> </div> </div> <div class="col-md-3"> <div class="collapse navbar-collapse" id="headernav_collapse"> <ul class="nav navbar-nav navbar-right" id="headernav"> <li class="headernav_store"><a href="//www.tianjin-qmedu.com/es/products/get-matlab.html?s_tid=gn_getml" class="btn btn_color_blue companion_btn btn-xs">Consiga Matlab.<GydF4y2Ba/a></li> </ul> </div> </div> </div> </div> </nav> </div>    <div class="section_header level_3"> <div class="container-fluid"> <div class="row" id="mobile_search_row"> <div class="col-sm-6 col-md-7 has_horizontal_local_nav" id="section_header_title"> <div class="section_header_content"> <div class="section_header_title"> <p class="h1"><a xmlns="http://www.w3.org/1999/xhtml" href="//www.tianjin-qmedu.com/es/help/index.html" class="coming_from_product">文档<GydF4y2Ba/a><a xmlns="http://www.w3.org/1999/xhtml" href="//www.tianjin-qmedu.com/es/help/index.html" class="not_coming_from_product"><span class="doc_section_title">帮助中心<GydF4y2Ba/span><span class="archived_doc_section_title">文档<GydF4y2Ba/span></a></p> </div> </div> </div> <div class="col-xs-12 col-sm-6 col-md-5" id="mobile_search"> <div class="search_nested_content_container"> <div id="search_scope_support" class="collapse in"> <form id="docsearch_form" action="/support/search.html" method="get" accept-charset="utf-8" data-release="R2021b" data-language="es"> <div class="input-group"> <label class="sr-only">布斯卡索波特酒店<GydF4y2Ba/label> <input id="suggestion" type="hidden" name="suggestion" value=""> <span role="status" aria-live="polite" class="ui-helper-hidden-accessible"></span> <input id="docsearch" class="form-control conjoined_search" type="search" name="q" placeholder="Buscar en Soporte" autocomplete="off"> <div class="input-group-btn"> <button type="button" class="btn btn_search_adjacent dropdown-toggle" data-toggle="dropdown"><span class="caret"></span><span class="search_scope_label">索波特<GydF4y2Ba/span></button> <ul class="dropdown-menu list-unstyled dropdown-menu-right" role="menu"> <li data-toggle="collapse" data-target="#search_scope_site" class="support_search_scope_trigger"><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#">Mathworks.<GydF4y2Ba/a></li> </ul> <button type="submit" name="submitsearch" id="support_submitsearch" class="btn icon-search btn_search_adjacent btn_search icon_16"></button> </div> </div> </form> </div> <div id="search_scope_site" class="collapse"> <form name="search" id="site_search" class="site_search" action="/search/site_search.html" method="get"> <div class="input-group"> <label class="sr-only">搜索MathWorks.com<GydF4y2Ba/label> <input type="hidden" name="c[]" value="整个_site.GydF4y2Ba"> <input type="search" name="q" id="query" class="form-control conjoined_search" placeholder="Search MathWorks.com" autocomplete="off" \=""> <div class="input-group-btn"> <button type="button" class="btn btn_search_adjacent dropdown-toggle" data-toggle="dropdown"><span class="caret"></span><span class="search_scope_label">Mathworks.<GydF4y2Ba/span></button> <ul class="dropdown-menu list-unstyled dropdown-menu-right" role="menu"> <li data-toggle="collapse" data-target="#search_scope_support" class="site_search_scope_trigger"><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#">万博1manbetx</a></li> </ul> <button type="submit" id="searchbutton" class="btn icon-search btn_search_adjacent btn_search icon_16"></button> </div> </div> </form> </div> </div> <button class="btn icon-remove btn_search pull-right icon_32 visible-xs" data-toggle="collapse" href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#mobile_search" aria-expanded="false" aria-controls="mobile_search"><span class="sr-only">关闭移动搜索<GydF4y2Ba/span></button> </div> <div class="visible-xs" id="search_actuator"> <button class="btn icon-search btn_search pull-right icon_16" data-toggle="collapse" href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#mobile_search" aria-expanded="false" aria-controls="mobile_search"><span class="sr-only">开放式移动搜索<GydF4y2Ba/span></button> </div> </div> </div> </div>   <div class="row-offcanvas row-offcanvas-left"> <div class="sidebar-offcanvas" id="sidebar"> <nav class="offcanvas_nav" role="navigation"> <div class="offcanvas_actuator" data-toggle="offcanvas" data-target="#sidebar" id="nav_toggle"> <button type="button" class="btn"><span class="sr-only">off-canvas导航菜单切换<GydF4y2Ba/span><span class="icon-menu"></span></button> <span class="offcanvas_actuator_label" id="translation_icon-menu" tabindex="-1" aria-hidden="true"></span>  </div> <div class="nav_list_wrapper" id="nav_list_wrapper"> <nav class="offcanvas_nav" role="navigation"> <ul xmlns="http://www.w3.org/1999/xhtml" class="nav_breadcrumb" id="ul_left_nav_ancestors"> <li itemscope itemtype="http://www.data-vocabulary.org/Breadcrumb" itemprop="breadcrumb"><a href="//www.tianjin-qmedu.com/es/help/index.html?s_tid=CRUX_lftnav" itemprop="url"><span itemprop="title">文档主页<GydF4y2Ba/span></a></li> </ul> <ul xmlns="http://www.w3.org/1999/xhtml" class="nav_disambiguation"> <li><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/index.html?s_tid=CRUX_lftnav">强化学习工具箱<GydF4y2Ba/a></li> <li itemscope itemtype="http://www.data-vocabulary.org/Breadcrumb" itemprop="breadcrumb"><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/training-and-validation.html?s_tid=CRUX_lftnav" itemprop="url"><span itemprop="title">培训和验证<GydF4y2Ba/span></a></li> </ul> <ul xmlns="http://www.w3.org/1999/xhtml" class="nav_scrollspy nav"> <li class="nav_scrollspy_function"><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#responsive_offcanvas">培训DDPG用于自适应巡航控制的代理<GydF4y2Ba/a></li> <li class="nav_scrollspy_title" id="SSPY810-section">在这一页上<GydF4y2Ba/li>  <li><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#TrainDDPGAgentForACCExample-1" class="intrnllnk">万博1manbetxSimulink模型<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#TrainDDPGAgentForACCExample-2" class="intrnllnk">创建环境界面<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#TrainDDPGAgentForACCExample-3" class="intrnllnk">创建DDPG代理<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#TrainDDPGAgentForACCExample-4" class="intrnllnk">列车员<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#TrainDDPGAgentForACCExample-5" class="intrnllnk">模拟DDPG代理<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#TrainDDPGAgentForACCExample-6" class="intrnllnk">重置功能<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#d123e21005" class="intrnllnk">另见<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#d123e21011" class="intrnllnk">相关话题<GydF4y2Ba/a></li> </ul> </nav> </div> </nav> </div>   <div class="offcanvas_content_container"> <div class="sticky_header_container"> <div class="horizontal_nav"> <div class="horizontal_nav_container"> <div class="offcanvas_horizontal_nav"> <div class="container-fluid"> <div class="row"> <div class="col-sm-12 col-md-7 col-lg-8 hidden-xs"> <nav class="navbar navbar-default" role="navigation" id="subnav"> <div> <ul class="nav navbar-nav crux_browse"> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_documentation" class="crux_resource active"><a class="not_coming_from_product">文档<GydF4y2Ba/a><a class="coming_from_product">全部的<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_example" class="crux_resource"><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/examples.html?category=training-and-validation&s_tid=CRUX_topnav">例子<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_function" class="crux_resource"><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/referencelist.html?type=function&category=training-and-validation&s_tid=CRUX_topnav">功能<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_block" class="crux_resource"><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/referencelist.html?type=block&category=training-and-validation&s_tid=CRUX_topnav">块<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_app" class="crux_resource"><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/referencelist.html?type=app&category=training-and-validation&s_tid=CRUX_topnav">应用<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_videos" class="supplemental_crux_resource"><a href="//www.tianjin-qmedu.com/es/support/search.html?fq[]=asset_type_name:video%20category:reinforcement-learning/training-and-validation&s_tid=CRUX_topnav" class="not_coming_from_product">视频<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_answers" class="supplemental_crux_resource"><a href="//www.tianjin-qmedu.com/es/support/search.html?fq[]=asset_type_name:answer%20category:reinforcement-learning/training-and-validation&s_tid=CRUX_topnav" class="not_coming_from_product">答案<GydF4y2Ba/a></li> </ul> </div> </nav> </div> <div class="col-md-5 col-lg-4 hidden-xs hidden-sm"> <div class="cta_box"> <ul class="list-inline"> <li class="cta_item cta_item_general hidden-sm hidden-xs "><a href="//www.tianjin-qmedu.com/es/campaigns/products/trials.html?prodcode=RL&s_iid=doc_trial_RL_tb" class="icon-download">审判<GydF4y2Ba/a></li> <li class="hidden-lg hidden-md "><a href="//www.tianjin-qmedu.com/es/campaigns/products/trials.html?prodcode=RL&s_iid=doc_trial_RL_tb" class="btn btn_color_blue btn-block"><span class="icon-download"></span>审判<GydF4y2Ba/a></li> <li class="cta_item cta_item_general hidden-sm hidden-xs "><a href="//www.tianjin-qmedu.com/es/support/web_downloads_bounce.html?s_cid=1008_degr_docdn_270055" class="icon-download">Actualizaciones de或含<GydF4y2Ba/a></li> <li class="hidden-lg hidden-md "><a href="//www.tianjin-qmedu.com/es/support/web_downloads_bounce.html?s_cid=1008_degr_docdn_270055" class="btn btn_color_blue btn-block"><span class="icon-download"></span>Actualizaciones de或含<GydF4y2Ba/a></li> </ul> </div> </div>  <div class="visible-xs"> <div class="container-fluid"> <div class="row"> <div class="col-xs-9"> <div class="mobile_crux_nav_trigger">  <div class="btn-group"> <button type="button" class="btn btn-default dropdown-toggle" data-toggle="dropdown" aria-haspopup="true" aria-expanded="false">recursos Adicionales.<GydF4y2Baspan class="icon-arrow-down icon_16"></span></button> <ul class="dropdown-menu"> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_documentation" class="crux_resource active"><a class="not_coming_from_product">文档<GydF4y2Ba/a><a class="coming_from_product">全部的<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_example" class="crux_resource"><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/examples.html?category=training-and-validation&s_tid=CRUX_topnav">例子<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_function" class="crux_resource"><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/referencelist.html?type=function&category=training-and-validation&s_tid=CRUX_topnav">功能<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_block" class="crux_resource"><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/referencelist.html?type=block&category=training-and-validation&s_tid=CRUX_topnav">块<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_app" class="crux_resource"><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/referencelist.html?type=app&category=training-and-validation&s_tid=CRUX_topnav">应用<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_videos" class="supplemental_crux_resource"><a href="//www.tianjin-qmedu.com/es/support/search.html?fq[]=asset_type_name:video%20category:reinforcement-learning/training-and-validation&s_tid=CRUX_topnav" class="not_coming_from_product">视频<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_answers" class="supplemental_crux_resource"><a href="//www.tianjin-qmedu.com/es/support/search.html?fq[]=asset_type_name:answer%20category:reinforcement-learning/training-and-validation&s_tid=CRUX_topnav" class="not_coming_from_product">答案<GydF4y2Ba/a></li> </ul> </div>  </div> </div> <div class="col-xs-3"> <div class="translate_placeholder"></div> </div> </div> </div> </div>  </div> </div> </div> </div> </div> </div> <div class="content_container" id="content_container" tabindex="-1"> <div class="container-fluid"> <div class="row"> <div class="col-xs-12"> <div id="offcanvas_focus_actuator" tabindex="0" class="visible-xs"> <span class="sr-only">主要内容<GydF4y2Ba/span> </div> <section xmlns="http://www.w3.org/1999/xhtml" id="doc_center_content" itemprop="content" lang="en" data-language="en"> <div id="pgtype-topic"> <section itemprop="content"> <h1 class="r2021b" itemprop="title content" id="mw_e4e63d67-bb1a-4120-85cf-b20338729d59">培训DDPG用于自适应巡航控制的代理<GydF4y2Ba/h1> <div class="pull-right examples_short_list" style="width:250px; margin-left: 10px; margin-bottom: 10px;"> <div data-pane="metadata" style="margin-bottom: 0px;" class="panel panel-default metadata_container"> <div class="panel-body metadata_content"> <p class="add_margin_0">此示例使用：<GydF4y2Ba/p> <ul class="list-unstyled example_product_list" itemprop="requiredprods"> <li><a class="coming_from_product" href="matlab:matlab.internal.language.introspective.showAddon('RL')">强化学习工具箱<GydF4y2Ba/a><a class="not_coming_from_product" href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/index.html">强化学习工具箱<GydF4y2Ba/a></li> <li><a class="coming_from_product" href="matlab:matlab.internal.language.introspective.showAddon('NN')">深度学习工具箱<GydF4y2Ba/a><a class="not_coming_from_product" href="//www.tianjin-qmedu.com/es/help/deeplearning/index.html">深度学习工具箱<GydF4y2Ba/a></li> <li><a class="coming_from_product" href="matlab:matlab.internal.language.introspective.showAddon('SL')">万博1manbetx</a><a class="not_coming_from_product" href="//www.tianjin-qmedu.com/es/help/simulink/index.html">万博1manbetx</a></li> </ul> <div class="clearfix add_margin_10"></div> <div class="row"> <div class="col-xs-12"> <a class="btn btn_secondary btn-block" href="matlab:openExample('control_deeplearning/TrainDDPGAgentForACCExample')" data-ex-genre="Live Script">打开实时脚本<GydF4y2Ba/a> </div> </div> </div> </div> </div> <div itemscope itemtype="//www.tianjin-qmedu.com/help/schema/MathWorksDocPage/Example" itemprop="example" class="em_example"> <meta itemprop="exampleid" content="control_deeplearning-TrainDDPGAgentForACCExample"> <meta itemprop="exampletitle" content="Train DDPG Agent for Adaptive Cruise Control"> </div> <span id="TrainDDPGAgentForACCExample" class="anchor_target"></span> <p class="shortdesc">此示例显示了如何在Simulink®中为自适应巡航控制（ACC）培训深层确定性策略梯度（DDPG）代理。有关DDPG代理的更多信息，请参阅万博1manbetx<A.href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/ddpg-agents.html" class="a">深度确定性政策梯度代理<GydF4y2Ba/a>．<GydF4y2Ba/p> <div class="procedure"> <h3 class="title" id="TrainDDPGAgentForACCExample-1">万博1manbetxSimulink模型<GydF4y2Ba/h3> <p>此示例的增强学习环境是自助式汽车和铅轿车的简单纵向动态。培训目标是使自助式汽车以设定的速度行驶，同时通过控制纵向加速和制动来维持沿线轿厢的安全距离。此示例使用相同的车型模型<A.href="//www.tianjin-qmedu.com/es/help/mpc/ug/adaptive-cruise-control-using-model-predictive-controller.html" class="a">基于模型预测控制的自适应巡航控制系统<GydF4y2Ba/a><span role="cross_prod">（模型预测控制工具箱）<GydF4y2Ba/span>的例子。<GydF4y2Ba/p> <p>指定两辆车的初始位置和速度。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>x0_铅=50；<GydF4y2Baspan style="color:#228B22">铅轿厢（M）的％初始位置<GydF4y2Ba/span>v0_铅=25；<GydF4y2Baspan style="color:#228B22">铅轿车的初始速度（M / s）<GydF4y2Ba/span>x0_=10；<GydF4y2Baspan style="color:#228B22">%ego车辆的初始位置（m）<GydF4y2Ba/span>v0_=20；<GydF4y2Baspan style="color:#228B22">自我车初始速度% (m/s)<GydF4y2Ba/span></pre> </div> </div> </div> <p>指定静止默认间隔（m），时间间隙和驱动器设置速度（M / s）。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>D_default = 10;t_gap = 1.4;v_set = 30;<GydF4y2Ba/pre> </div> </div> </div> <p>要模拟车辆动力学的物理限制，请将加速度限制在范围内<GydF4y2Bacode class="literal">[-3,2]<GydF4y2Ba/code>m / s ^ 2。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>阿明•伊戈=-3；阿玛克斯•伊戈=2；<GydF4y2Ba/pre> </div> </div> </div> <p>定义采样时间<GydF4y2Bacode class="literal">TS.<GydF4y2Ba/code>和模拟持续时间<GydF4y2Bacode class="literal">TF.<GydF4y2Ba/code>几秒钟之内。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>t = 0.1;Tf = 60;<GydF4y2Ba/pre> </div> </div> </div> <p>打开模型。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>mdl =<GydF4y2Baspan style="color:#A020F0">“rlACCMdl”<GydF4y2Ba/span>;Open_System（MDL）AppletBlk = [MDL<GydF4y2Baspan style="color:#A020F0">“/RL代理”<GydF4y2Ba/span>］;<GydF4y2Ba/pre> </div> </div> </div> <div class="informalfigure"> <div id="d123e20659" class="mediaobject"> <p><img src="//www.tianjin-qmedu.com/es/help/examples/control_deeplearning/win64/TrainDDPGAgentForACCExample_01.png" alt="" height="481" width="1202" style="width: 1202px; height: 481px"></p> </div> </div> <p>对于此模型：<GydF4y2Ba/p> <div class="itemizedlist"> <ul> <li><p>从代理到环境的加速度动作信号为-3到2 m/s^2。<GydF4y2Ba/p></li> <li><p>自助式汽车的参考速度<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <mi> v<GydF4y2Ba/mi> </mrow> <mrow> <mi> R<GydF4y2Ba/mi> <mi> E<GydF4y2Ba/mi> <mi> F<GydF4y2Ba/mi> </mrow> </msub> </mrow> </math></span>定义如下。如果相对距离小于安全距离，自我车跟踪领先车速度和驾驶员设定速度的最小值。以这种方式，自我车与领先车保持一定的距离。如果相对距离大于安全距离，自我汽车跟踪驾驶者设定的速度。在这个例子中，安全距离被定义为自我汽车纵向速度的一个线性函数<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mi mathvariant="italic"> v<GydF4y2Ba/mi> </mrow> </math></span>；即，<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <mi> T<GydF4y2Ba/mi> </mrow> <mrow> <mi> G<GydF4y2Ba/mi> <mi> A.<GydF4y2Ba/mi> <mi> P<GydF4y2Ba/mi> </mrow> </msub> <mo> *<GydF4y2Ba/mo> <mi> v<GydF4y2Ba/mi> <mo> +<GydF4y2Ba/mo> <msub> <mrow> <mi> D<GydF4y2Ba/mi> </mrow> <mrow> <mi> D<GydF4y2Ba/mi> <mi> E<GydF4y2Ba/mi> <mi> F<GydF4y2Ba/mi> <mi> A.<GydF4y2Ba/mi> <mi> U<GydF4y2Ba/mi> <mi> L<GydF4y2Ba/mi> <mi> T<GydF4y2Ba/mi> </mrow> </msub> </mrow> </math></span>．安全距离决定了自我车的参考跟踪速度。<GydF4y2Ba/p></li> <li><p>环境的观察是速度误差<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <mi> E<GydF4y2Ba/mi> <mo> =<GydF4y2Ba/mo> <msub> <mrow> <mi> v<GydF4y2Ba/mi> </mrow> <mrow> <mi> R<GydF4y2Ba/mi> <mi> E<GydF4y2Ba/mi> <mi> F<GydF4y2Ba/mi> </mrow> </msub> <mo> -<GydF4y2Ba/mo> <msub> <mrow> <mi> v<GydF4y2Ba/mi> </mrow> <mrow> <mi> E<GydF4y2Ba/mi> <mi> G<GydF4y2Ba/mi> <mi> o<GydF4y2Ba/mi> </mrow> </msub> </mrow> </math></span>，它的积分<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <mo stretchy="false"> ∫<GydF4y2Ba/mo> <mi> E<GydF4y2Ba/mi> </mrow> </math></span>，以及自助式汽车纵向速度<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mi mathvariant="italic"> v<GydF4y2Ba/mi> </mrow> </math></span>．<GydF4y2Ba/p></li> <li><p>当自助车的纵向速度小于0的纵向速度或引线轿厢和自助轿车之间的相对距离变得小于0时，模拟终止。<GydF4y2Ba/p></li> <li><p>奖赏<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true"> <msub> <mrow> <mi mathvariant="italic"> R<GydF4y2Ba/mi> </mrow> <mrow> <mi mathvariant="italic"> T<GydF4y2Ba/mi> </mrow> </msub> </math></span>，每次都提供<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mi mathvariant="italic"> T<GydF4y2Ba/mi> </mrow> </math></span>是<GydF4y2Ba/p></li> </ul> </div> <p></p> <div class="code_responsive"> <p class="programlistingindent"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <mi> R<GydF4y2Ba/mi> </mrow> <mrow> <mi> T<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mo> -<GydF4y2Ba/mo> <mo stretchy="false"> (<GydF4y2Ba/mo> <mn> 0<GydF4y2Ba/mn> <mo stretchy="false"> ．<GydF4y2Ba/mo> <mn> 1.<GydF4y2Ba/mn> <msubsup> <mrow> <mi> E<GydF4y2Ba/mi> </mrow> <mrow> <mi> T<GydF4y2Ba/mi> </mrow> <mrow> <mn> 2.<GydF4y2Ba/mn> </mrow> </msubsup> <mo> +<GydF4y2Ba/mo> <msubsup> <mrow> <mi> U<GydF4y2Ba/mi> </mrow> <mrow> <mi> T<GydF4y2Ba/mi> <mo> -<GydF4y2Ba/mo> <mn> 1.<GydF4y2Ba/mn> </mrow> <mrow> <mn> 2.<GydF4y2Ba/mn> </mrow> </msubsup> <mo stretchy="false"> )<GydF4y2Ba/mo> <mo> +<GydF4y2Ba/mo> <msub> <mrow> <mi> M<GydF4y2Ba/mi> </mrow> <mrow> <mi> T<GydF4y2Ba/mi> </mrow> </msub> </mrow> </math></p> </div> <p></p> <p>在哪里<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <mi> U<GydF4y2Ba/mi> </mrow> <mrow> <mi> T<GydF4y2Ba/mi> <mo> -<GydF4y2Ba/mo> <mn> 1.<GydF4y2Ba/mn> </mrow> </msub> </mrow> </math></span>是从前一步的控制输入。逻辑价值<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> M<GydF4y2Ba/mi> </mrow> <mrow> <mi> T<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mn> 1.<GydF4y2Ba/mn> </mrow> </math></span>如果速度错误<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msubsup> <mrow> <mi> E<GydF4y2Ba/mi> </mrow> <mrow> <mi> T<GydF4y2Ba/mi> </mrow> <mrow> <mn> 2.<GydF4y2Ba/mn> </mrow> </msubsup> <mo> <<GydF4y2Ba/mo> <mo> =<GydF4y2Ba/mo> <mn> 0<GydF4y2Ba/mn> <mo stretchy="false"> ．<GydF4y2Ba/mo> <mn> 2.<GydF4y2Ba/mn> <mn> 5.<GydF4y2Ba/mn> </mrow> </math></span>;除此以外，<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> M<GydF4y2Ba/mi> </mrow> <mrow> <mi> T<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mn> 0<GydF4y2Ba/mn> </mrow> </math></span>．<GydF4y2Ba/p> <h3 class="title" id="TrainDDPGAgentForACCExample-2">创建环境界面<GydF4y2Ba/h3> <p>为模型创建强化学习环境界面。<GydF4y2Ba/p> <p>创建观察规范。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>observationInfo=rlNumericSpec（[3 1]，<GydF4y2Baspan style="color:#A020F0">'lowerimit'<GydF4y2Ba/span>，-inf*one（3,1），<GydF4y2Baspan style="color:#A020F0">“上限”<GydF4y2Ba/span>,正* (3,1));observationInfo。Name =<GydF4y2Baspan style="color:#A020F0">'观察'<GydF4y2Ba/span>; 观测信息描述=<GydF4y2Baspan style="color:#A020F0">“关于速度误差和自我速度的信息”<GydF4y2Ba/span>;<GydF4y2Ba/pre> </div> </div> </div> <p>创建操作规范。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>actionInfo = rlNumericSpec([1 1]，<GydF4y2Baspan style="color:#A020F0">'lowerimit'<GydF4y2Ba/span>3,<GydF4y2Baspan style="color:#A020F0">“上限”<GydF4y2Ba/span>，2）；actionInfo.Name=<GydF4y2Baspan style="color:#A020F0">“加速”<GydF4y2Ba/span>;<GydF4y2Ba/pre> </div> </div> </div> <p>创建环境接口。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>env = rl万博1manbetxSimulinkEnv (mdl agentblk、observationInfo actionInfo);<GydF4y2Ba/pre> </div> </div> </div> <p>要定义领头车位置的初始条件，请使用匿名函数句柄指定环境重置函数。重置函数<GydF4y2Bacode class="literal">本地重置FCN<GydF4y2Ba/code>，在示例的末尾定义，随机化引线轿厢的初始位置。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>env.ResetFcn=@（in）localResetFcn（in）；<GydF4y2Ba/pre> </div> </div> </div> <p>修复随机生成器种子的再现性。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>rng (<GydF4y2Baspan style="color:#A020F0">“默认”<GydF4y2Ba/span>)<GydF4y2Ba/pre> </div> </div> </div> <h3 class="title" id="TrainDDPGAgentForACCExample-3">创建DDPG代理<GydF4y2Ba/h3> <p>DDPG代理使用临界值函数表示来近似给定观察和行动的长期回报。要创建批评家，首先创建一个具有两个输入、状态和动作以及一个输出的深度神经网络。有关创建神经网络值函数表示的详细信息，请参见<A.href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/create-policy-and-value-function-representations.html" class="a">创建策略和值函数表示<GydF4y2Ba/a>．<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>L=48；<GydF4y2Baspan style="color:#228B22">％神经元数量<GydF4y2Ba/span>statepath = [featuredupputlayer（3，<GydF4y2Baspan style="color:#A020F0">'正常化'<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">“没有”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">'观察'<GydF4y2Ba/span>）全连接层（L，<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">'fc1'<GydF4y2Ba/span>)雷卢耶(<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">“relu1”<GydF4y2Ba/span>）全连接层（L，<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">'fc2'<GydF4y2Ba/span>)附加层（2，<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">'添加'<GydF4y2Ba/span>)雷卢耶(<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">'relu2'<GydF4y2Ba/span>）全连接层（L，<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">'fc3'<GydF4y2Ba/span>)雷卢耶(<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">'relu3'<GydF4y2Ba/span>）全康连接层（1，<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">'fc4'<GydF4y2Ba/span>)]; actionPath=[featureInputLayer（1，<GydF4y2Baspan style="color:#A020F0">'正常化'<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">“没有”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">“行动”<GydF4y2Ba/span>）全连接层（L，<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">'fc5'<GydF4y2Ba/span>));criticNetwork = layerGraph (statePath);= addLayers(criticNetwork, actionPath);criticNetwork = connectLayers (criticNetwork,<GydF4y2Baspan style="color:#A020F0">'fc5'<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">'添加/ in2'<GydF4y2Ba/span>);<GydF4y2Ba/pre> </div> </div> </div> <p>查看网络配置。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>绘图（关键网络）<GydF4y2Ba/pre> </div> </div> </div> <div class="informalfigure"> <div id="d123e20899" class="mediaobject"> <p><img src="//www.tianjin-qmedu.com/es/help/examples/control_deeplearning/win64/TrainDDPGAgentForACCExample_02.png" alt="图包含轴对象。轴对象包含Type Graphplot的对象。GydF4y2Ba" width="583" style="width: 583px"></p> </div> </div> <p>使用指定批评家表示的选项<A.href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ref/rlrepresentationoptions.html" class="a"><code class="olink">rlRepresentationOptions<GydF4y2Ba/code></a>．<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>临界点=rlRepresentationOptions(<GydF4y2Baspan style="color:#A020F0">“LearnRate”<GydF4y2Ba/span>，1e-3，<GydF4y2Baspan style="color:#A020F0">“梯度阈值”<GydF4y2Ba/span>，1，<GydF4y2Baspan style="color:#A020F0">'l2regularizationfactor'<GydF4y2Ba/span>，1e-4）；<GydF4y2Ba/pre> </div> </div> </div> <p>使用指定的神经网络和选项创建批评家表示。还必须指定批评家的操作和观察信息，这些信息是从环境界面获得的。有关更多信息，请参阅<A.href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ref/rlqvaluerepresentation.html" class="a"><code class="olink">rlqvalueerepresentation<GydF4y2Ba/code></a>．<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>critic=rlQValueRepresentation（关键网络、观测信息、动作信息、，<GydF4y2Baspan style="color:#0000FF">......<GydF4y2Ba/span><span style="color:#A020F0">'观察'<GydF4y2Ba/span>，{<GydF4y2Baspan style="color:#A020F0">'观察'<GydF4y2Ba/span>}，<GydF4y2Baspan style="color:#A020F0">“行动”<GydF4y2Ba/span>，{<GydF4y2Baspan style="color:#A020F0">“行动”<GydF4y2Ba/span>}, criticOptions);<GydF4y2Ba/pre> </div> </div> </div> <p>DDPG代理通过使用参与者表示来决定执行给定观察的操作。要创建演员，首先创建一个深度神经网络，一个输入，一个观察，一个输出，一个动作。<GydF4y2Ba/p> <p>以类似于批评家的方式构造参与者。有关更多信息，请参阅<A.href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ref/rldeterministicactorrepresentation.html" class="a"><code class="olink">RLDETerminyActorRepresentation<GydF4y2Ba/code></a>．<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>actorNetwork=[featureInputLayer（3，<GydF4y2Baspan style="color:#A020F0">'正常化'<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">“没有”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">'观察'<GydF4y2Ba/span>）全连接层（L，<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">'fc1'<GydF4y2Ba/span>)雷卢耶(<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">“relu1”<GydF4y2Ba/span>）全连接层（L，<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">'fc2'<GydF4y2Ba/span>)雷卢耶(<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">'relu2'<GydF4y2Ba/span>）全连接层（L，<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">'fc3'<GydF4y2Ba/span>)雷卢耶(<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">'relu3'<GydF4y2Ba/span>）全康连接层（1，<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">'fc4'<GydF4y2Ba/span>) tanhLayer (<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">'tanh1'<GydF4y2Ba/span>)缩放层(<GydF4y2Baspan style="color:#A020F0">“姓名”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">“ActorScaling1”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">“规模”<GydF4y2Ba/span>,2.5,<GydF4y2Baspan style="color:#A020F0">'偏见'<GydF4y2Ba/span>，-0.5）];ACTOROPTIONS = RLREPRESENTATIONOPTIONS（<GydF4y2Baspan style="color:#A020F0">“LearnRate”<GydF4y2Ba/span>，1e-4，<GydF4y2Baspan style="color:#A020F0">“梯度阈值”<GydF4y2Ba/span>，1，<GydF4y2Baspan style="color:#A020F0">'l2regularizationfactor'<GydF4y2Ba/span>，1e-4）；actor = rldeterminyactorrepresentation（Actornetwork，观察ini，actioninfo，<GydF4y2Baspan style="color:#0000FF">......<GydF4y2Ba/span><span style="color:#A020F0">'观察'<GydF4y2Ba/span>，{<GydF4y2Baspan style="color:#A020F0">'观察'<GydF4y2Ba/span>}，<GydF4y2Baspan style="color:#A020F0">“行动”<GydF4y2Ba/span>，{<GydF4y2Baspan style="color:#A020F0">“ActorScaling1”<GydF4y2Ba/span>}, actorOptions);<GydF4y2Ba/pre> </div> </div> </div> <p>要创建DDPG代理，请首先使用指定DDPG代理选项<A.href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ref/rlddpgagentoptions.html" class="a"><code class="olink">rlDDPGAgentOptions<GydF4y2Ba/code></a>．<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>agentOptions=rlDDPGAgentOptions(<GydF4y2Baspan style="color:#0000FF">......<GydF4y2Ba/span><span style="color:#A020F0">'采样时间'<GydF4y2Ba/span>，ts，<GydF4y2Baspan style="color:#0000FF">......<GydF4y2Ba/span><span style="color:#A020F0">“目标平滑因子”<GydF4y2Ba/span>，1e-3，<GydF4y2Baspan style="color:#0000FF">......<GydF4y2Ba/span><span style="color:#A020F0">“经验缓冲长度”<GydF4y2Ba/span>，1e6，<GydF4y2Baspan style="color:#0000FF">......<GydF4y2Ba/span><span style="color:#A020F0">“折扣演员”<GydF4y2Ba/span>,0.99,<GydF4y2Baspan style="color:#0000FF">......<GydF4y2Ba/span><span style="color:#A020F0">'minibatchsize'<GydF4y2Ba/span>,64); agentOptions.NoiseOptions.Variance=0.6；agentOptions.NoiseOptions.VarianceDecayRate=1e-5；<GydF4y2Ba/pre> </div> </div> </div> <p>然后，使用指定的参与者表示、评论家表示和代理选项创建DDPG代理。有关更多信息，请参阅<A.href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ref/rlddpgagent.html" class="a"><code class="olink">rlddpgagent.<GydF4y2Ba/code></a>．<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>代理= rlDDPGAgent(演员、评论家、agentOptions);<GydF4y2Ba/pre> </div> </div> </div> <h3 class="title" id="TrainDDPGAgentForACCExample-4">列车员<GydF4y2Ba/h3> <p>要培训代理，首先指定培训选项。对于此示例，请使用以下选项：<GydF4y2Ba/p> <div class="itemizedlist"> <ul> <li><p>每次训练最多进行一次<GydF4y2Bacode class="literal">5000<GydF4y2Ba/code>每集最多600个时间步。<GydF4y2Ba/p></li> <li><p>在Episode Manager对话框中显示培训进度。<GydF4y2Ba/p></li> <li><p>当代理收到大于260的情节奖励时停止训练。<GydF4y2Ba/p></li> </ul> </div> <p>有关更多信息，请参阅<A.href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ref/rltrainingoptions.html" class="a"><code class="olink">RL培训选项<GydF4y2Ba/code></a>．<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>maxepisodes = 5000;maxsteps =装天花板(Tf / Ts);trainingOpts = rlTrainingOptions (<GydF4y2Baspan style="color:#0000FF">......<GydF4y2Ba/span><span style="color:#A020F0">“MaxEpisodes”<GydF4y2Ba/span>，maxepisodes，<GydF4y2Baspan style="color:#0000FF">......<GydF4y2Ba/span><span style="color:#A020F0">“MaxStepsPerEpisode”<GydF4y2Ba/span>，maxsteps，<GydF4y2Baspan style="color:#0000FF">......<GydF4y2Ba/span><span style="color:#A020F0">'verbose'<GydF4y2Ba/span>错误的<GydF4y2Baspan style="color:#0000FF">......<GydF4y2Ba/span><span style="color:#A020F0">“情节”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">'培训 - 进步'<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#0000FF">......<GydF4y2Ba/span><span style="color:#A020F0">“停止培训标准”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">“情节报酬”<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#0000FF">......<GydF4y2Ba/span><span style="color:#A020F0">“停止训练值”<GydF4y2Ba/span>，260）;<GydF4y2Ba/pre> </div> </div> </div> <p>训练代理人使用<A.href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ref/rl.agent.rlqagent.train.html" class="a"><code class="olink">火车<GydF4y2Ba/code></a>功能。培训是一个计算密集的过程，需要几分钟才能完成。要在运行此示例的同时节省时间，请通过设置加载预制代理<GydF4y2Bacode class="literal">溺爱<GydF4y2Ba/code>到<GydF4y2Bacode class="literal">错误的<GydF4y2Ba/code>.要亲自培训特工，请设置<GydF4y2Bacode class="literal">溺爱<GydF4y2Ba/code>到<GydF4y2Bacode class="literal">符合事实的<GydF4y2Ba/code>．<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>dotraining = false;<GydF4y2Baspan style="color:#0000FF">如果<GydF4y2Ba/span>溺爱<GydF4y2Baspan style="color:#228B22">％训练代理人。<GydF4y2Ba/span>Trainstats =火车（代理，ENV，Trainpepopts）;<GydF4y2Baspan style="color:#0000FF">其他的<GydF4y2Ba/span><span style="color:#228B22">%为示例加载预训练的代理。<GydF4y2Ba/span>加载（<GydF4y2Baspan style="color:#A020F0">'万博1manbetxsimulinkaccddpg.mat'<GydF4y2Ba/span>,<GydF4y2Baspan style="color:#A020F0">'代理人'<GydF4y2Ba/span>)<GydF4y2Baspan style="color:#0000FF">终止<GydF4y2Ba/span></pre> </div> </div> </div> <div class="informalfigure"> <div id="d123e20969" class="mediaobject"> <p><img src="//www.tianjin-qmedu.com/es/help/examples/control_deeplearning/win64/TrainDDPGAgentForACCExample_03.png" alt="" height="539" width="897" style="width: 897px; height: 539px"></p> </div> </div> <h3 class="title" id="TrainDDPGAgentForACCExample-5">模拟DDPG代理<GydF4y2Ba/h3> <p>要验证培训的代理的性能，请通过取消注释以下命令来模拟Simulink环境中的代理。万博1manbetx有关代理模拟的更多信息，请参阅<A.href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ref/rlsimulationoptions.html" class="a"><code class="olink">rlSimulationOptions<GydF4y2Ba/code></a>和<A.href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ref/rl.env.abstractenv.sim.html" class="a"><code class="olink">模拟<GydF4y2Ba/code></a>．<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre><span style="color:#228B22">%simOptions=rlSimulationOptions（'MaxSteps'，MaxSteps）；<GydF4y2Ba/span><span style="color:#228B22">%经验=模拟（环境、代理、模拟选项）；<GydF4y2Ba/span></pre> </div> </div> </div> <p>要使用确定性初始条件演示经过训练的agent，请在Simulink中模拟该模型。万博1manbetx<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>x0_lead = 80;SIM（MDL）<GydF4y2Ba/pre> </div> </div> </div> <p>以下情节显示了当铅轿车在自助轿厢之前70（m）时显示仿真结果。<GydF4y2Ba/p> <div class="itemizedlist"> <ul> <li><p>在前28秒，相对距离大于安全距离(底部图)，所以自我汽车轨迹设定速度(中间图)。为了加速并达到设定的速度，加速度是正的(上图)。<GydF4y2Ba/p></li> <li><p>从28到60秒，相对距离小于安全距离（底部图），因此自我车辆追踪引线速度和设定速度的最小值。从28到36秒，引线速度小于设定的速度（中间图）。为了减速并跟踪铅轿厢速度，加速是负（顶部图）。从36到60秒，自助式汽车调整其加速以跟踪参考速度（中间图）。在此时间间隔内，自助式汽车将设定的速度从43到52秒追踪，并将引线速度从36到43秒跟踪到52到60秒。<GydF4y2Ba/p></li> </ul> </div> <div class="informalfigure"> <div id="d123e20992" class="mediaobject"> <p><img src="//www.tianjin-qmedu.com/es/help/examples/control_deeplearning/win64/TrainDDPGAgentForACCExample_04.png" alt="" height="804" width="409" style="width: 409px; height: 804px"></p> </div> </div> <p>关闭Simulink万博1manbetx模型。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>bdclose（mdl）<GydF4y2Ba/pre> </div> </div> </div> <h3 class="title" id="TrainDDPGAgentForACCExample-6">重置功能<GydF4y2Ba/h3> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre><span style="color:#0000FF">作用<GydF4y2Ba/span>在= localresetfcn（in）<GydF4y2Baspan style="color:#228B22">％重置引线轿厢的初始位置。<GydF4y2Ba/span>在= setVariable（在，<GydF4y2Baspan style="color:#A020F0">'x0_lead'<GydF4y2Ba/span>，40+randi（60,1,1））；<GydF4y2Baspan style="color:#0000FF">终止<GydF4y2Ba/span></pre> </div> </div> </div> </div> <h2 id="d123e21005">另见<GydF4y2Ba/h2> <p><span itemscope itemtype="//www.tianjin-qmedu.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso"><a itemprop="url" href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ref/rl.agent.rlqagent.train.html"><span itemprop="name"><code class="function">火车<GydF4y2Ba/code></span></a></span></p> <h2 id="d123e21011">相关话题<GydF4y2Ba/h2> <ul> <li><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/train-reinforcement-learning-agents.html" class="a">培训强化学习代理<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/create-policy-and-value-function-representations.html" class="a">创建策略和值函数表示<GydF4y2Ba/a></li> </ul> </section> </div> <div class="modal fade" id="open-example-dialog" tabindex="-1" role="dialog" aria-labelledby="openExampleDialogLabel" aria-hidden="true"> <div class="modal-dialog"> <div class="modal-content"> <div class="modal-header"> <button type="button" class="close" data-dismiss="modal" aria-label="Close"><span aria-hidden="true">×<GydF4y2Ba/span></button> <h2 class="modal-title">阿布里尔·埃坎波<GydF4y2Ba/h2> </div> <div class="modal-body" id="dialog-body"> <p>这是一个新版本。您是否同意修改合同？<GydF4y2Ba/p> </div> <div class="modal-footer"> <a id="open-example-dialog-replace" class="btn btn_color_blue companion_btn" data-dismiss="modal">不，这是一个修改版本<GydF4y2Ba/a> <a id="open-example-dialog-continue" class="btn btn_color_blue" data-dismiss="modal">Sí.<GydF4y2Ba/a> </div> </div> </div> </div> <div class="clearfix"></div> <div align="center" class="feedbackblock"> <iframe id="doc_survey"></iframe> </div> </section> <div class="modal fade" id="matlab-command-dialog" tabindex="-1" role="dialog" aria-labelledby="matlabCommandDialogLabel" aria-hidden="true"> <div class="modal-dialog"> <div class="modal-content"> <div class="modal-header"> <button type="button" class="close" data-dismiss="modal" aria-label="Close"><span aria-hidden="true">×<GydF4y2Ba/span></button> <h2 class="modal-title">MATLAB公司<GydF4y2Ba/h2> </div> <div class="modal-body" id="dialog-body"> <p>Ha Hecho Clic en en enrace que参考este comando de matlab：<GydF4y2Ba/p> <pre id="dialog-matlab-command"></pre> <p>ejecute el comandoinsuciéndoloen la Ventana de comandos de matlab。los navegadores网站没有adminiten comandos de matlab。<GydF4y2Ba/p> </div> <div class="modal-footer"> <button type="button" class="btn btn_secondary" data-dismiss="modal">斯卡尔<GydF4y2Ba/button> </div> </div> </div> </div> <div id="location_content" style="display:none;"></div> <div class="modal fade" id="country-unselected" tabindex="-1" role="dialog" aria-labelledby="country-unselected-title" translate="no"> <div id="country-select-container"> <div class="modal-dialog modal-lg"> <div class="modal-content"> <div class="modal-header"> <button type="button" class="close" data-dismiss="modal" aria-label="Close"><span aria-hidden="true">×<GydF4y2Ba/span></button> <img alt="Mathworks.GydF4y2Ba" src="//www.tianjin-qmedu.com/es/images/responsive/global/pic-header-mathworks-logo2.svg" style="width:167px; height:auto;"> </div> <div class="modal-body"> <div class="row add_margin_40"> <div class="col-xs-12"> <h1 class="icon-globe icon_color_secondary" id="country-unselected-title">选择一个网站<GydF4y2Ba/h1> <p>选择一个网站，以便在可用的地方进行翻译的内容，并查看本地活动和优惠。根据您的位置，我们建议您选择：<GydF4y2Bastrong class="recommended-country"></strong>．<GydF4y2Ba/p> <a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#" id="recommended_domain_button" class="btn btn_color_blue containsResourceName resourceClass-button">选择<GydF4y2Baspan class="recommended-country"></span>网站<GydF4y2Ba/a> </div> </div> <p>您还可以从以下列表中选择网站：<GydF4y2Ba/p> <div class="alert alert-warning" id="china_performance_alert" style="display:none;"> <span class="alert_icon icon-alert-warning"></span> <h2>如何获得最佳网站性能<GydF4y2Ba/h2> <p>选择中国站点（中文或英文）以获得最佳站点性能。其他MathWorks国家/地区站点不适合您所在位置的访问。<GydF4y2Ba/p> </div> <div class="row add_margin_30"> <div class="col-sm-4 col-md-3"> <h3 class="add_bottom_rule">美洲<GydF4y2Ba/h3> <ul class="list-unstyled"> <li><a href="//www.tianjin-qmedu.com/la" class="domain_selector_link" data-country-code="LA" data-subdomain="la" data-lang="es" data-default-lang="true" data-selected-text="América Latina" data-recommended-text="América Latina" data-do-not-rewrite="true">美国拉丁<GydF4y2Ba/a>（Español）<GydF4y2Ba/li> <li><a href="//www.tianjin-qmedu.com/es/" class="domain_selector_link" data-country-code="CA" data-subdomain="www" data-lang="en" data-do-not-rewrite="true">加拿大<GydF4y2Ba/a>（英语）<GydF4y2Ba/li> <li><a href="//www.tianjin-qmedu.com/es/" class="domain_selector_link" data-country-code="US" data-subdomain="www" data-lang="en" data-default-lang="true" data-selected-text="United States" data-recommended-text="United States" data-do-not-rewrite="true">美国<GydF4y2Ba/a>（英语）<GydF4y2Ba/li> </ul> </div> <div class="col-sm-4 col-md-6"> <h3 class="add_bottom_rule">欧洲<GydF4y2Ba/h3> <div class="row"> <div class="col-xs-6 col-sm-12 col-md-6"> <ul class="list-unstyled add_margin_0_sm"> <li><a href="//www.tianjin-qmedu.com/nl" class="domain_selector_link" data-country-code="BE" data-subdomain="nl" data-lang="en" data-do-not-rewrite="true">比利时<GydF4y2Ba/a>（英语）<GydF4y2Ba/li> <li><a href="//www.tianjin-qmedu.com/se" class="domain_selector_link" data-country-code="DK" data-subdomain="se" data-lang="en" data-do-not-rewrite="true">丹麦<GydF4y2Ba/a>（英语）<GydF4y2Ba/li> <li><a href="//www.tianjin-qmedu.com/de" class="domain_selector_link" data-country-code="DE" data-subdomain="de" data-lang="de" data-default-lang="true" data-selected-text="Deutschland" data-recommended-text="Deutschland" data-do-not-rewrite="true">德意志<GydF4y2Ba/a>（德国）<GydF4y2Ba/li> <li><a href="//www.tianjin-qmedu.com/es/" class="domain_selector_link" data-country-code="ES" data-subdomain="es" data-lang="es" data-default-lang="true" data-selected-text="España" data-recommended-text="España" data-do-not-rewrite="true">埃斯帕尼亚<GydF4y2Ba/a>（Español）<GydF4y2Ba/li> <li><a href="//www.tianjin-qmedu.com/se" class="domain_selector_link" data-country-code="FI" data-subdomain="se" data-lang="en" data-do-not-rewrite="true">芬兰<GydF4y2Ba/a>（英语）<GydF4y2Ba/li> <li><a href="//www.tianjin-qmedu.com/fr" class="domain_selector_link" data-country-code="FR" data-subdomain="fr" data-lang="fr" data-default-lang="true" data-selected-text="France" data-recommended-text="France" data-do-not-rewrite="true">法国<GydF4y2Ba/a>（法兰西）<GydF4y2Ba/li> <li><a href="//www.tianjin-qmedu.com/uk" class="domain_selector_link" data-country-code="IE" data-subdomain="uk" data-lang="en" data-do-not-rewrite="true">爱尔兰<GydF4y2Ba/a>（英语）<GydF4y2Ba/li> <li><a href="//www.tianjin-qmedu.com/it" class="domain_selector_link" data-country-code="IT" data-subdomain="it" data-lang="it" data-default-lang="true" data-selected-text="Italia" data-recommended-text="Italia" data-do-not-rewrite="true">意大利<GydF4y2Ba/a>（意大利语）<GydF4y2Ba/li> <li><a href="//www.tianjin-qmedu.com/nl" class="domain_selector_link" data-country-code="LU" data-subdomain="nl" data-lang="en" data-do-not-rewrite="true">卢森堡<GydF4y2Ba/a>（英语）<GydF4y2Ba/li> </ul> </div> <div class="col-xs-6 col-sm-12 col-md-6"> <ul class="list-unstyled"> <li><a href="//www.tianjin-qmedu.com/nl" class="domain_selector_link" data-country-code="NL" data-subdomain="nl" data-lang="en" data-default-lang="true" data-selected-text="Benelux" data-recommended-text="Netherlands" data-do-not-rewrite="true">荷兰<GydF4y2Ba/a>（英语）<GydF4y2Ba/li> <li><a href="//www.tianjin-qmedu.com/se" class="domain_selector_link" data-country-code="NO" data-subdomain="se" data-lang="en" data-do-not-rewrite="true">挪威<GydF4y2Ba/a>（英语）<GydF4y2Ba/li> <li><a href="//www.tianjin-qmedu.com/de" class="domain_selector_link" data-country-code="AT" data-subdomain="de" data-lang="de" data-do-not-rewrite="true">Österreich<GydF4y2Ba/a>（德国）<GydF4y2Ba/li> <li><a href="//www.tianjin-qmedu.com/es/" class="domain_selector_link" data-country-code="PT" data-subdomain="www" data-lang="en" data-do-not-rewrite="true">葡萄牙<GydF4y2Ba/a>（英语）<GydF4y2Ba/li> <li><a href="//www.tianjin-qmedu.com/se" class="domain_selector_link" data-country-code="Sweden" data-subdomain="se" data-lang="en" data-default-lang="true" data-selected-text="Nordic" data-recommended-text="Sweden" data-do-not-rewrite="true">瑞典<GydF4y2Ba/a>（英语）<GydF4y2Ba/li> <li>瑞士<ULclass="list-unstyled add_indent_20"> <li><a href="//www.tianjin-qmedu.com/ch" class="domain_selector_link" data-country-code="CH" data-subdomain="ch" data-lang="de" data-selected-text="Schweiz" data-recommended-text="Schweiz" data-do-not-rewrite="true">德国<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/ch" id="swiss_english" class="domain_selector_link" data-country-code="CH" data-subdomain="ch" data-lang="en" data-default-lang="true" data-selected-text="Switzerland" data-recommended-text="Switzerland" data-do-not-rewrite="true">英语<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/ch" class="domain_selector_link" data-country-code="CH" data-subdomain="ch" data-lang="fr" data-selected-text="Suisse" data-recommended-text="Suisse" data-do-not-rewrite="true">Français.<GydF4y2Ba/a></li> </ul></li> <li><a href="//www.tianjin-qmedu.com/uk" class="domain_selector_link" data-country-code="GB" data-subdomain="uk" data-lang="en" data-default-lang="true" data-selected-text="United Kingdom" data-recommended-text="United Kingdom" data-do-not-rewrite="true">联合王国<GydF4y2Ba/a>（英语）<GydF4y2Ba/li> </ul> </div> </div> </div> <div class="col-sm-4 col-md-3"> <h3 class="add_bottom_rule">亚太地区<GydF4y2Ba/h3> <ul class="list-unstyled"> <li><a href="//www.tianjin-qmedu.com/au" class="domain_selector_link" data-country-code="AU" data-subdomain="au" data-lang="en" data-default-lang="true" data-selected-text="Australia" data-recommended-text="Australia" data-do-not-rewrite="true">澳大利亚<GydF4y2Ba/a>（英语）<GydF4y2Ba/li> <li><a href="//www.tianjin-qmedu.com/in" class="domain_selector_link" data-country-code="IN" data-subdomain="in" data-lang="en" data-default-lang="true" data-selected-text="India" data-recommended-text="India" data-do-not-rewrite="true">印度<GydF4y2Ba/a>（英语）<GydF4y2Ba/li> <li><a href="//www.tianjin-qmedu.com/au" class="domain_selector_link" data-country-code="NZ" data-subdomain="au" data-lang="en" data-do-not-rewrite="true">新西兰<GydF4y2Ba/a>（英语）<GydF4y2Ba/li> <li>中国人<ULclass="list-unstyled add_indent_20"> <li><a href="https://ww2.mathworks.cn" class="domain_selector_link" data-country-code="CN" data-subdomain="ww2" data-lang="zh" data-default-lang="true" data-selected-text="中国" data-recommended-text="中国" data-do-not-rewrite="true">简体中文<GydF4y2Ba/a></li> <li><a href="https://ww2.mathworks.cn" class="domain_selector_link" data-country-code="CN" data-subdomain="ww2" data-lang="en" data-default-lang="true" data-selected-text="China" data-recommended-text="China" data-do-not-rewrite="true">英语<GydF4y2Ba/a></li> </ul></li> <li><a href="//www.tianjin-qmedu.com/jp" class="domain_selector_link" data-country-code="JP" data-subdomain="jp" data-lang="ja" data-default-lang="true" data-selected-text="日本" data-recommended-text="日本" data-do-not-rewrite="true">日本语<GydF4y2Ba/a>(日本語)<GydF4y2Ba/li> <li><a href="//www.tianjin-qmedu.com/kr" class="domain_selector_link" data-country-code="KR" data-subdomain="kr" data-lang="ko" data-default-lang="true" data-selected-text="한국" data-recommended-text="한국" data-do-not-rewrite="true">한국<GydF4y2Ba/a>(한국어)<GydF4y2Ba/li> </ul> </div> </div> <p class="text-center"><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#" class="worldwide_link">联系您当地的办公室<GydF4y2Ba/a></p> </div> </div> </div> </div> </div> </div> </div> </div> </div>  <div class="cta_container_mobile visible-sm visible-xs"> <div class="container-fluid"> <div class="row"> <div class="col-xs-12"> <div class="cta_box"> <ul class="list-inline"> <li class="cta_item cta_item_general hidden-sm hidden-xs "><a href="//www.tianjin-qmedu.com/es/campaigns/products/trials.html?prodcode=RL&s_iid=doc_trial_RL_tb" class="icon-download">审判<GydF4y2Ba/a></li> <li class="hidden-lg hidden-md "><a href="//www.tianjin-qmedu.com/es/campaigns/products/trials.html?prodcode=RL&s_iid=doc_trial_RL_tb" class="btn btn_color_blue btn-block"><span class="icon-download"></span>审判<GydF4y2Ba/a></li> <li class="cta_item cta_item_general hidden-sm hidden-xs "><a href="//www.tianjin-qmedu.com/es/support/web_downloads_bounce.html?s_cid=1008_degr_docdn_270055" class="icon-download">Actualizaciones de或含<GydF4y2Ba/a></li> <li class="hidden-lg hidden-md "><a href="//www.tianjin-qmedu.com/es/support/web_downloads_bounce.html?s_cid=1008_degr_docdn_270055" class="btn btn_color_blue btn-block"><span class="icon-download"></span>Actualizaciones de或含<GydF4y2Ba/a></li> </ul> </div> </div> </div> </div> </div>   <div class="body_trail_container"> <div class="container-fluid"> <div class="row"> <div class="col-xs-12"> <div class="row"> <div class="col-xs-12 col-sm-4"> <h2><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/index.html?s_tid=doc_ftr">强化学习工具箱文档<GydF4y2Ba/a></h2> <ul class="list-unstyled hidden-xs"> <li><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/examples.html?s_tid=doc_ftr">例子<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/referencelist.html?type=function&s_tid=doc_ftr">功能和其他参考<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/release-notes.html?s_tid=doc_ftr">发布说明<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/help/pdf_doc/reinforcement-learning/index.html?s_tid=doc_ftr">PDF文档<GydF4y2Ba/a></li> </ul> </div> <div class="col-xs-12 col-sm-4"> <h2><a href="//www.tianjin-qmedu.com/es/support.html?s_tid=doc_ftr">万博1manbetx</a></h2> <ul class="list-unstyled hidden-xs"> <li><a href="//www.tianjin-qmedu.com/es/matlabcentral/answers/index?s_tid=doc_ftr">MATLAB答案<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/help/install/?s_tid=doc_ftr">安装帮助<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/support/bugreports/?s_tid=doc_ftr">错误报告<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/support/requirements/product-requirements-platform-availability-list.html?s_tid=doc_ftr">产品需求<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/downloads/?s_tid=doc_ftr">常用软件下载<GydF4y2Ba/a></li> </ul> </div> <div class="col-xs-12 col-sm-4"> <div class="panel panel_color_transparent panel_color_fill"> <div class="panel-body"> <div class="thumbnail add_margin_5"> <a href="//www.tianjin-qmedu.com/es/campaigns/offers/reinforcement-learning-with-matlab-ebook.html?s_iid=doc_eb_RL_footer"><img class="fluid_image" alt="用Matlab和Simulink加强学习万博1manbetxGydF4y2Ba" src="//www.tianjin-qmedu.com/es/content/dam/mathworks/mathworks-dot-com/images/responsive/supporting/campaigns/products/reinforcement-learning-ebook-offer-thumbnail.jpg"></a> </div> <h4><a href="//www.tianjin-qmedu.com/es/campaigns/offers/reinforcement-learning-with-matlab-ebook.html?s_iid=doc_eb_RL_footer">用Matlab和Simulink加强学习万博1manbetx<GydF4y2Ba/a></h4> <a class="icon-download" href="//www.tianjin-qmedu.com/es/campaigns/offers/reinforcement-learning-with-matlab-ebook.html?s_iid=doc_eb_RL_footer">下载电子书<GydF4y2Ba/a> </div> </div> </div> </div> </div> </div> </div> </div>  <footer id="footer" class="bs-footer">  <div class="container-fluid"> <div class="fat_footer_container"> <div class="fat_footer"> <div class="execmatlabweb">  <div class="row"> <div class="col-xs-12 col-md-12 col-lg-3 add_margin_20"> <p class="h4 add_margin_0"><span translate="no">Mathworks.<GydF4y2Ba/span></p> <p><em>加快工程和科学的步伐<GydF4y2Ba/em></p> <p class="hidden-xs">MathWorks是一家软件公司，该公司的软件生产商<GydF4y2Ba/p> <p class="hidden-xs"><a href="//www.tianjin-qmedu.com/es/discovery.html?s_tid=all_disc_mw_ff">描述。。。<GydF4y2Ba/a></p> </div> <div class="col-xs-12 col-md-12 col-lg-9"> <div class="row"> <div class="col-xs-12 col-sm-2"> <p class="ff_section_title"><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#fatfooter_products" role="button" data-toggle="collapse" aria-expanded="false" aria-controls="fatfooter_products">探险家产品<GydF4y2Baspan class="caret"></span></a></p> <div class="collapse" id="fatfooter_products"> <ul class="list-unstyled"> <li><a href="//www.tianjin-qmedu.com/es/products/matlab.html?s_tid=hp_ff_p_matlab">马铃薯<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/products/simulink.html?s_tid=hp_ff_p_simulink">万博1manbetx</a></li> <li><a href="//www.tianjin-qmedu.com/es/products/matlab/student.html?s_tid=hp_ff_p_student">软件大学生联队帕拉<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/hardware-support/home.html?s_tid=hp_ff_p_hwsupport">Soporte对位硬件<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/matlabcentral/fileexchange/?s_tid=hp_ff_p_fx">文件交换<GydF4y2Ba/a></li> </ul> </div> </div> <div class="col-xs-12 col-sm-2"> <p class="ff_section_title"><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#fatfooter_buy" role="button" data-toggle="collapse" aria-expanded="false" aria-controls="fatfooter_buy">先证者<GydF4y2Baspan class="caret"></span></a></p> <div class="collapse" id="fatfooter_buy"> <ul class="list-unstyled"> <li><a href="//www.tianjin-qmedu.com/es/downloads/web_downloads/?s_iid=hp_ff_t_downloads">descargas.<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/campaigns/products/trials.html?s_iid=hp_ff_p_trial">软件de prueba.<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/company/aboutus/contact_us/contact_sales.html?s_iid=hp_ff_t_sales">Contactar Con Ventas.<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/pricing-licensing.html?s_iid=hp_ff_t_pricing">precios y licencias.<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/store/?s_tid=hp_ff_t_buy">科莫·康帕尔<GydF4y2Ba/a></li> </ul> </div> </div> <div class="col-xs-12 col-sm-2"> <p class="ff_section_title"><a role="button" data-toggle="collapse" href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#fatfooter_use" aria-expanded="false" aria-controls="fatfooter_use">Apender utultizar.<GydF4y2Baspan class="caret"></span></a></p> <div class="collapse" id="fatfooter_use"> <ul class="list-unstyled"> <li><a href="//www.tianjin-qmedu.com/es/help/?s_tid=hp_ff_l_doc">más reciente文档<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/support/learn-with-matlab-tutorials.html?s_tid=hp_ff_l_tutorials">教程<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/help/examples.html?s_tid=hp_ff_l_examples">ejegros.<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/videos.html?s_tid=hp_ff_l_videos">维迪奥斯网络研讨会<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/services/training.html?s_tid=hp_ff_l_training">形式<GydF4y2Ba/a></li> </ul> </div> </div> <div class="clearfix" id="offcanvas_clearfix" style="display:none"></div> <div class="col-xs-12 col-sm-2"> <p class="ff_section_title"><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#fatfooter_support" role="button" data-toggle="collapse" aria-expanded="false" aria-controls="fatfooter_support">奥本纳·索波特<GydF4y2Baspan class="caret"></span></a></p> <div class="collapse" id="fatfooter_support"> <ul class="list-unstyled"> <li><a href="//www.tianjin-qmedu.com/es/help/install/?s_tid=hp_ff_s_install">阿尤达·帕拉·安塔拉西翁酒店<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/matlabcentral/answers/index?s_tid=hp_ff_s_answers">Respuestas.<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/services/consulting.html?s_tid=hp_ff_s_consulting">Consultoría.<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/licensecenter/?s_tid=hp_ff_s_license">Centro de licencias.<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/support/contact_us.html?s_tid=hp_ff_s_support">Contactar Con Soporte.<GydF4y2Ba/a></li> </ul> </div> </div> <div class="col-xs-12 col-sm-2"> <p class="ff_section_title"><a role="button" data-toggle="collapse" href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#fatfooter_about" aria-expanded="false" aria-controls="fatfooter_about">Acerca de MathWorks<GydF4y2Baspan class="caret"></span></a></p> <div class="collapse" id="fatfooter_about"> <ul class="list-unstyled"> <li><a href="//www.tianjin-qmedu.com/es/company/jobs/opportunities.html?s_tid=hp_ff_a_careers">ofertas de Empleo.<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/company/newsroom.html?s_tid=hp_ff_a_newsroom">普伦萨沙拉酒店<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/company/aboutus/soc_mission.html?s_tid=hp_ff_a_socialmission">米西翁社会<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/company/aboutus/contact_us/contact_sales.html?s_tid=hp_ff_a_sales">Contactar Con Ventas.<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/es/company.html?s_tid=hp_ff_a_company">Acerca de MathWorks<GydF4y2Ba/a></li> </ul> </div> </div> </div> </div> </div> </div> </div> </div> </div>  <div class="container-fluid"> <div class="footer" translate="no"> <div class="row"> <div class="col-xs-12 col-md-9"> <ul class="countrynav" id="countrynav"> <li class="footernav_country"><a href="//www.tianjin-qmedu.com/es/help/reinforcement-learning/ug/#" data-toggle="modal" data-target="#country-unselected"><span class="icon-globe icon_color_quinary icon_16"></span>埃斯帕尼亚<GydF4y2Ba/a></li> </ul> <div class="clearfix"></div> <ul class="footernav"> <li class="footernav_patents"><a href="//www.tianjin-qmedu.com/es/company/aboutus/policies_statements/trust-center.html?s_tid=gf_tc">确认中心<GydF4y2Ba/a></li> <li class="footernav_trademarks"><a href="//www.tianjin-qmedu.com/es/company/aboutus/policies_statements/trademarks.html?s_tid=gf_trd">马卡报商业<GydF4y2Ba/a></li> <li class="footernav_privacy"><a href="//www.tianjin-qmedu.com/es/company/aboutus/policies_statements.html?s_tid=gf_priv">私有政策<GydF4y2Ba/a></li> <li class="footernav_piracy"><a href="//www.tianjin-qmedu.com/es/company/aboutus/policies_statements/piracy.html?s_tid=gf_pir">反海盗<GydF4y2Ba/a></li> <li class="footernav_status"><a href="//www.tianjin-qmedu.com/status/?s_tid=gf_application">奥斯塔多<GydF4y2Ba/a></li> </ul> <div class="clearfix"></div> <div class="clearfix"></div> <p class="copyright" translate="no">©1994-2021 The MathWorks公司<GydF4y2Ba/p> </div> <div class="clearfix visible-sm add_margin_10"></div> <div class="col-xs-12 col-md-3"> <div class="social_media"> <ul class="social_media_icons"> <li><a href="https://www.facebook.com/MATLAB" target="_blank" rel="nofollow noopener noreferrer" class="svg_link"><img src="//www.tianjin-qmedu.com/es/images/responsive/global/ico-facebook.svg" alt="脸谱网GydF4y2Ba" class="ico_facebook"></a></li> <li><a href="https://www.twitter.com/MATLAB" target="_blank" rel="nofollow noopener noreferrer" class="svg_link"><img src="//www.tianjin-qmedu.com/es/images/responsive/global/ico-twitter.svg" alt="推特GydF4y2Ba" class="ico_twitter"></a></li> <li><a href="https://www.instagram.com/matlab/" class="svg_link" target="_blank" rel="nofollow noopener noreferrer"><img class="ico_instagram" alt="Instagram.GydF4y2Ba" src="//www.tianjin-qmedu.com/es/etc.clientlibs/mathworks/clientlibs/customer-ui/templates/common/resources/images/ico-instagram.svg"></a></li> <li><a href="https://www.youtube.com/user/MATLAB" class="svg_link" target="_blank" rel="nofollow noopener noreferrer"><img class="ico_youtube" alt="YouTubeGydF4y2Ba" src="//www.tianjin-qmedu.com/es/images/responsive/global/ico-youtube.svg"></a></li> <li><a href="https://www.linkedin.com/company/the-mathworks_2" target="_blank" rel="nofollow noopener noreferrer" class="svg_link"><img src="//www.tianjin-qmedu.com/es/images/responsive/global/ico-linkedin.svg" alt="linkedin.GydF4y2Ba" class="ico_linkedin"></a></li> <li><a href="//www.tianjin-qmedu.com/es/company/rss.html" class="svg_link"><img src="//www.tianjin-qmedu.com/es/images/responsive/global/ico-rss.svg" alt="rss.GydF4y2Ba" class="ico_rss"></a></li> </ul> <div class="clearfix"></div> <p><em>Únase a la conversación<GydF4y2Ba/em></p> </div> </div> </div> </div> <div id="cookie-banner-text" style="display:none;"> 本网站使用cookie来改善您的用户体验，个性化内容和广告，并分析网站流量。继续使用本网站，即表示您同意我们使用cookies。请参阅我们的<A.href="//www.tianjin-qmedu.com/es/company/aboutus/policies_statements.html">隐私政策<GydF4y2Ba/a>要了解有关cookie的更多信息以及如何更改设置。<GydF4y2Ba/div> </div> </footer> </div> </div>  </body> </html>