训练多个代理以遵循控制路径-MATLAB和SIMULINK -MATHWORKS FRANCE万博1manbetx<GydF4y2Ba/title> <link href="//www.tianjin-qmedu.com/fr/includes_content/responsive/css/bootstrap/bootstrap.min.css" rel="stylesheet" type="text/css"> <link href="//www.tianjin-qmedu.com/fr/includes_content/responsive/css/site6.css?202109" rel="stylesheet" type="text/css"> <link href="//www.tianjin-qmedu.com/fr/includes_content/responsive/css/site6_lg.css?202109" rel="stylesheet" media="screen and (min-width: 1200px)"> <link href="//www.tianjin-qmedu.com/fr/includes_content/responsive/css/site6_md.css?202109" rel="stylesheet" media="screen and (min-width: 992px) and (max-width: 1199px)"> <link href="//www.tianjin-qmedu.com/fr/includes_content/responsive/css/site6_sm+xs.css?202109" rel="stylesheet" media="screen and (max-width: 991px)"> <link href="//www.tianjin-qmedu.com/fr/includes_content/responsive/css/site6_sm.css?202109" rel="stylesheet" media="screen and (min-width: 768px) and (max-width: 991px)"> <link href="//www.tianjin-qmedu.com/fr/includes_content/responsive/css/site6_xs.css?202109" rel="stylesheet" media="screen and (max-width: 767px)"> <link href="//www.tianjin-qmedu.com/fr/includes_content/responsive/css/site6_offcanvas_v2.css?202109" rel="stylesheet" type="text/css"> <link href="//www.tianjin-qmedu.com/fr/includes_content/responsive/css/site7_crux.css?202109" rel="stylesheet" type="text/css"> <link href="//www.tianjin-qmedu.com/fr/includes_content/responsive/css/localized/site6_fr.css" rel="stylesheet" type="text/css"> <link href="//www.tianjin-qmedu.com/fr/includes_content/releases/R2021b/css/doc_center.css?202109" rel="stylesheet" type="text/css"> <link href="//www.tianjin-qmedu.com/fr/includes_content/releases/R2021b/css/doc_center_print.css?202109" rel="stylesheet" type="text/css" media="print"> <link href="//www.tianjin-qmedu.com/fr/includes_content/releases/R2021b/css/doc_center_fr.css?202109" rel="stylesheet" type="text/css"> <style> .examples_short_list a.btn {display: none;} </style> <style> .typeahead_container.typeahead_type_grouped { margin-left:0; } @media (min-width:768px) { #suggestions { margin-left:-100px } } </style> </head> <body id="responsive_offcanvas"> <a class="skip_link sr-only" href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#content_container">Skip to content</a>  <div class="header visible-xs visible-sm" id="header_mobile" translate="no"> <nav class="navbar navbar-default" role="navigation"> <div class="navbar-header"> <div class="container-fluid"> <div class="row"> <div class="col-xs-3"> <button type="button" class="navbar-toggle topnav_toggle" data-toggle="collapse" data-target="#topnav_collapse"><span class="sr-only">Toggle Main Navigation</span><span class="icon-menu"></span></button> </div> <div class="col-xs-6"> <div class="text-center"> <a href="//www.tianjin-qmedu.com/fr/?s_tid=gn_logo" class="svg_link navbar-brand"><img src="//www.tianjin-qmedu.com/fr/images/responsive/global/pic-header-mathworks-logo.svg" class="mw_logo" alt="数学工作GydF4y2Ba"></a> </div> </div> <div class="col-xs-3"> <div class="matrix_affordance_container_mobile" id="matrix_affordance_container_mobile"></div> </div> </div> </div> </div> <div class="container-fluid"> <div class="row visible-xs visible-sm"> <div class="col-xs-12"> <div class="navbar-collapse collapse" id="topnav_collapse"> <ul class="nav navbar-nav" id="topnav"> <li class="topnav_products "><a href="//www.tianjin-qmedu.com/fr/products.html?s_tid=gn_ps">产品<GydF4y2Ba/a></li> <li class="topnav_solutions "><a href="//www.tianjin-qmedu.com/fr/solutions.html?s_tid=gn_sol">万博尤文图斯</a></li> <li class="topnav_academia "><a href="//www.tianjin-qmedu.com/fr/academia.html?s_tid=gn_acad">Le MondeAcadémique<GydF4y2Ba/a></li> <li class="topnav_support "><a href="//www.tianjin-qmedu.com/fr/support.html?s_tid=gn_supp">万博1manbetx</a></li> <li class="topnav_community "><a href="//www.tianjin-qmedu.com/fr/matlabcentral/?s_tid=gn_mlc">Communauté</a></li> <li class="topnav_events "><a href="//www.tianjin-qmedu.com/fr/company/events.html?s_tid=gn_ev">Événements</a></li> <li class="headernav_store"><a href="//www.tianjin-qmedu.com/fr/products/get-matlab.html?s_tid=gn_getml">Obtenir MATLAB</a></li> </ul> </div> <div class="navbar-collapse collapse" id="matrix_collapse"> <div class="matrix_menu_container_mobile" id="matrix_menu_container_mobile"></div> </div> </div> </div> </div> </nav> </div>   <div class="header hidden-xs hidden-sm" id="header_desktop" translate="no"> <nav class="navbar navbar-default" role="navigation"> <div class="container-fluid"> <div class="row"> <div class="col-md-9"> <div class="navbar-header"> <div class="logo_container hidden-xs hidden-sm"> <a href="//www.tianjin-qmedu.com/fr/?s_tid=gn_logo" class="svg_link pull-left"><img src="//www.tianjin-qmedu.com/fr/images/responsive/global/pic-header-mathworks-logo.svg" class="mw_logo" alt="数学工作GydF4y2Ba"></a> </div> <div class="navbar-collapse collapse hidden-xs hidden-sm"> <ul class="nav navbar-nav" id="topnav"> <li class="topnav_products "><a href="//www.tianjin-qmedu.com/fr/products.html?s_tid=gn_ps">产品<GydF4y2Ba/a></li> <li class="topnav_solutions "><a href="//www.tianjin-qmedu.com/fr/solutions.html?s_tid=gn_sol">万博尤文图斯</a></li> <li class="topnav_academia "><a href="//www.tianjin-qmedu.com/fr/academia.html?s_tid=gn_acad">Le MondeAcadémique<GydF4y2Ba/a></li> <li class="topnav_support "><a href="//www.tianjin-qmedu.com/fr/support.html?s_tid=gn_supp">万博1manbetx</a></li> <li class="topnav_community "><a href="//www.tianjin-qmedu.com/fr/matlabcentral/?s_tid=gn_mlc">Communauté</a></li> <li class="topnav_events "><a href="//www.tianjin-qmedu.com/fr/company/events.html?s_tid=gn_ev">Événements</a></li> </ul> </div> </div> </div> <div class="col-md-3"> <div class="collapse navbar-collapse" id="headernav_collapse"> <ul class="nav navbar-nav navbar-right" id="headernav"> <li class="headernav_store"><a href="//www.tianjin-qmedu.com/fr/products/get-matlab.html?s_tid=gn_getml" class="btn btn_color_blue companion_btn btn-xs">Obtenir MATLAB</a></li> </ul> </div> </div> </div> </div> </nav> </div>    <div class="section_header level_3"> <div class="container-fluid"> <div class="row" id="mobile_search_row"> <div class="col-sm-6 col-md-7 has_horizontal_local_nav" id="section_header_title"> <div class="section_header_content"> <div class="section_header_title"> <p class="h1"><a xmlns="http://www.w3.org/1999/xhtml" href="//www.tianjin-qmedu.com/fr/fr/help/index.html" class="coming_from_product">文档<GydF4y2Ba/a><a xmlns="http://www.w3.org/1999/xhtml" href="//www.tianjin-qmedu.com/fr/fr/help/index.html" class="not_coming_from_product"><span class="doc_section_title">HelpCenter</span><span class="archived_doc_section_title">文档<GydF4y2Ba/span></a></p> </div> </div> </div> <div class="col-xs-12 col-sm-6 col-md-5" id="mobile_search"> <div class="search_nested_content_container"> <div id="search_scope_support" class="collapse in"> <form id="docsearch_form" action="/support/search.html" method="get" accept-charset="utf-8" data-release="R2021b" data-language="en"> <div class="input-group"> <label class="sr-only">搜索支持万博1manbetx<GydF4y2Ba/label> <input id="suggestion" type="hidden" name="suggestion" value=""> <span role="status" aria-live="polite" class="ui-helper-hidden-accessible"></span> <input id="docsearch" class="form-control conjoined_search" type="search" name="q" placeholder="Search Support" autocomplete="off"> <div class="input-group-btn"> <button type="button" class="btn btn_search_adjacent dropdown-toggle" data-toggle="dropdown"><span class="caret"></span><span class="search_scope_label">万博1manbetx</span></button> <ul class="dropdown-menu list-unstyled dropdown-menu-right" role="menu">  <li data-toggle="collapse" data-target="#search_scope_site" class="support_search_scope_trigger"><a href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#">数学工作<GydF4y2Ba/a></li> </ul> <button type="submit" name="submitsearch" id="support_submitsearch" class="btn icon-search btn_search_adjacent btn_search icon_16"></button> </div> </div> </form> </div> <div id="search_scope_site" class="collapse"> <form name="search" id="site_search" class="site_search" action="/search/site_search.html" method="get"> <div class="input-group"> <label class="sr-only">Search MathWorks.com</label> <input type="hidden" name="c[]" value="entire_site"> <input type="search" name="q" id="query" class="form-control conjoined_search" placeholder="Search MathWorks.com" autocomplete="off" \=""> <div class="input-group-btn"> <button type="button" class="btn btn_search_adjacent dropdown-toggle" data-toggle="dropdown"><span class="caret"></span><span class="search_scope_label">数学工作<GydF4y2Ba/span></button> <ul class="dropdown-menu list-unstyled dropdown-menu-right" role="menu"> <li data-toggle="collapse" data-target="#search_scope_support" class="site_search_scope_trigger"><a href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#">万博1manbetx</a></li> </ul> <button type="submit" id="searchbutton" class="btn icon-search btn_search_adjacent btn_search icon_16"></button> </div> </div> </form> </div> </div> <button class="btn icon-remove btn_search pull-right icon_32 visible-xs" data-toggle="collapse" href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#mobile_search" aria-expanded="false" aria-controls="mobile_search"><span class="sr-only">关闭移动搜索<GydF4y2Ba/span></button> </div> <div class="visible-xs" id="search_actuator"> <button class="btn icon-search btn_search pull-right icon_16" data-toggle="collapse" href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#mobile_search" aria-expanded="false" aria-controls="mobile_search"><span class="sr-only">打开移动搜索<GydF4y2Ba/span></button> </div> </div> </div> </div>   <div class="row-offcanvas row-offcanvas-left"> <div class="sidebar-offcanvas" id="sidebar"> <nav class="offcanvas_nav" role="navigation"> <div class="offcanvas_actuator" data-toggle="offcanvas" data-target="#sidebar" id="nav_toggle"> <button type="button" class="btn"><span class="sr-only">玻璃瓦斯导航菜单切换<GydF4y2Ba/span><span class="icon-menu"></span></button> <span class="offcanvas_actuator_label" id="translation_icon-menu" tabindex="-1" aria-hidden="true"></span>  </div> <div class="nav_list_wrapper" id="nav_list_wrapper"> <nav class="offcanvas_nav" role="navigation"> <ul xmlns="http://www.w3.org/1999/xhtml" class="nav_breadcrumb" id="ul_left_nav_ancestors"> <li itemscope itemtype="http://www.data-vocabulary.org/Breadcrumb" itemprop="breadcrumb"><a href="//www.tianjin-qmedu.com/fr/fr/help/index.html?s_tid=CRUX_lftnav" itemprop="url"><span itemprop="title">文档Home</span></a></li> </ul> <ul xmlns="http://www.w3.org/1999/xhtml" class="nav_disambiguation"> <li><a href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/index.html?s_tid=CRUX_lftnav">加固学习工具箱<GydF4y2Ba/a></li> <li itemscope itemtype="http://www.data-vocabulary.org/Breadcrumb" itemprop="breadcrumb"><a href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/training-and-validation.html?s_tid=CRUX_lftnav" itemprop="url"><span itemprop="title">Training and Validation</span></a></li> </ul> <ul xmlns="http://www.w3.org/1999/xhtml" class="nav_scrollspy nav"> <li class="nav_scrollspy_function"><a href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#responsive_offcanvas">训练多个代理以遵循控制路径<GydF4y2Ba/a></li> <li class="nav_scrollspy_title" id="SSPY810-section">On this page</li>  <li><a href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#TrainMultipleAgentsForPathFollowingControlExample-1" class="intrnllnk">Overview</a></li> <li><a href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#TrainMultipleAgentsForPathFollowingControlExample-2" class="intrnllnk">Create Environment</a></li> <li><a href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#TrainMultipleAgentsForPathFollowingControlExample-3" class="intrnllnk">创建代理<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#TrainMultipleAgentsForPathFollowingControlExample-6" class="intrnllnk">Train Agents</a></li> <li><a href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#TrainMultipleAgentsForPathFollowingControlExample-7" class="intrnllnk">Simulate Agents</a></li> <li><a href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#d123e20586" class="intrnllnk">也可以看看<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#d123e20594" class="intrnllnk">Related Topics</a></li> </ul> </nav> </div> </nav> </div>   <div class="offcanvas_content_container"> <div class="sticky_header_container"> <div class="horizontal_nav"> <div class="horizontal_nav_container"> <div class="offcanvas_horizontal_nav"> <div class="container-fluid"> <div class="row"> <div class="col-sm-12 col-md-7 col-lg-8 hidden-xs"> <nav class="navbar navbar-default" role="navigation" id="subnav"> <div> <ul class="nav navbar-nav crux_browse"> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_documentation" class="crux_resource active"><a class="not_coming_from_product">文档<GydF4y2Ba/a><a class="coming_from_product">All</a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_example" class="crux_resource"><a href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/examples.html?category=training-and-validation&s_tid=CRUX_topnav">Examples</a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_function" class="crux_resource"><a href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/referencelist.html?type=function&category=training-and-validation&s_tid=CRUX_topnav">功能<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_block" class="crux_resource"><a href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/referencelist.html?type=block&category=training-and-validation&s_tid=CRUX_topnav">Blocks</a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_app" class="crux_resource"><a href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/referencelist.html?type=app&category=training-and-validation&s_tid=CRUX_topnav">应用<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_videos" class="supplemental_crux_resource"><a href="//www.tianjin-qmedu.com/fr/support/search.html?fq[]=asset_type_name:video%20category:reinforcement-learning/training-and-validation&s_tid=CRUX_topnav" class="not_coming_from_product">videos</a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_answers" class="supplemental_crux_resource"><a href="//www.tianjin-qmedu.com/fr/support/search.html?fq[]=asset_type_name:answer%20category:reinforcement-learning/training-and-validation&s_tid=CRUX_topnav" class="not_coming_from_product">Answers</a></li> </ul> </div> </nav> </div> <div class="col-md-5 col-lg-4 hidden-xs hidden-sm"> <div class="cta_box"> <ul class="list-inline"> <li class="cta_item cta_item_general hidden-sm hidden-xs "><a href="//www.tianjin-qmedu.com/fr/campaigns/products/trials.html?prodcode=RL&s_iid=doc_trial_RL_tb" class="icon-download">Trials</a></li> <li class="hidden-lg hidden-md "><a href="//www.tianjin-qmedu.com/fr/campaigns/products/trials.html?prodcode=RL&s_iid=doc_trial_RL_tb" class="btn btn_color_blue btn-block"><span class="icon-download"></span>Trials</a></li> <li class="cta_item cta_item_general hidden-sm hidden-xs "><a href="//www.tianjin-qmedu.com/fr/support/web_downloads_bounce.html?s_cid=1008_degr_docdn_270055" class="icon-download">mises à jour du produit</a></li> <li class="hidden-lg hidden-md "><a href="//www.tianjin-qmedu.com/fr/support/web_downloads_bounce.html?s_cid=1008_degr_docdn_270055" class="btn btn_color_blue btn-block"><span class="icon-download"></span>mises à jour du produit</a></li> </ul> </div> </div>  <div class="visible-xs"> <div class="container-fluid"> <div class="row"> <div class="col-xs-9"> <div class="mobile_crux_nav_trigger">  <div class="btn-group"> <button type="button" class="btn btn-default dropdown-toggle" data-toggle="dropdown" aria-haspopup="true" aria-expanded="false">Resources<span class="icon-arrow-down icon_16"></span></button> <ul class="dropdown-menu"> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_documentation" class="crux_resource active"><a class="not_coming_from_product">文档<GydF4y2Ba/a><a class="coming_from_product">All</a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_example" class="crux_resource"><a href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/examples.html?category=training-and-validation&s_tid=CRUX_topnav">Examples</a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_function" class="crux_resource"><a href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/referencelist.html?type=function&category=training-and-validation&s_tid=CRUX_topnav">功能<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_block" class="crux_resource"><a href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/referencelist.html?type=block&category=training-and-validation&s_tid=CRUX_topnav">Blocks</a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_app" class="crux_resource"><a href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/referencelist.html?type=app&category=training-and-validation&s_tid=CRUX_topnav">应用<GydF4y2Ba/a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_videos" class="supplemental_crux_resource"><a href="//www.tianjin-qmedu.com/fr/support/search.html?fq[]=asset_type_name:video%20category:reinforcement-learning/training-and-validation&s_tid=CRUX_topnav" class="not_coming_from_product">videos</a></li> <li xmlns="http://www.w3.org/1999/xhtml" id="crux_nav_answers" class="supplemental_crux_resource"><a href="//www.tianjin-qmedu.com/fr/support/search.html?fq[]=asset_type_name:answer%20category:reinforcement-learning/training-and-validation&s_tid=CRUX_topnav" class="not_coming_from_product">Answers</a></li> </ul> </div>  </div> </div> <div class="col-xs-3"> <div class="translate_placeholder"></div> </div> </div> </div> </div>  </div> </div> </div> </div> </div> </div> <div class="content_container" id="content_container" tabindex="-1"> <div class="container-fluid"> <div class="row"> <div class="col-xs-12"> <div id="offcanvas_focus_actuator" tabindex="0" class="visible-xs"> <span class="sr-only">m一个in Content</span> </div> <section xmlns="http://www.w3.org/1999/xhtml" id="doc_center_content" itemprop="content" lang="en" data-language="en"> <div id="pgtype-topic"> <section itemprop="content"> <h1 class="r2021b" itemprop="title content" id="mw_a231508a-d1c9-4d81-91ca-e007ceb6f7b7">训练多个代理以遵循控制路径<GydF4y2Ba/h1> <div class="pull-right examples_short_list" style="width:250px; margin-left: 10px; margin-bottom: 10px;"> <div data-pane="metadata" style="margin-bottom: 0px;" class="panel metadata_container"> <div class="panel-body metadata_content" style="padding-top:0px; padding-bottom:0px;"> <div class="row"> <div class="col-xs-12"> <a class="btn btn_secondary btn-block" href="matlab:openExample('rl/TrainMultipleAgentsForPathFollowingControlExample')" data-ex-genre="Live Script">Open Live Script</a> </div> </div> </div> </div> </div> <div itemscope itemtype="//www.tianjin-qmedu.com/help/schema/MathWorksDocPage/Example" itemprop="example" class="em_example"> <meta itemprop="exampleid" content="rl-TrainMultipleAgentsForPathFollowingControlExample"> <meta itemprop="exampletitle" content="Train Multiple Agents for Path Following Control"> </div> <span id="TrainMultipleAgentsForPathFollowingControlExample" class="anchor_target"></span> <p class="shortdesc">This example shows how to train multiple agents to collaboratively perform path-following control (PFC) for a vehicle. The goal of PFC is to make the ego vehicle travel at a set velocity while maintaining a safe distance from a lead car by controlling longitudinal acceleration and braking, and also while keeping the vehicle travelling along the centerline of its lane by controlling the front steering angle. For more information on PFC, see<一个href="//www.tianjin-qmedu.com/fr/fr/help/mpc/ref/pathfollowingcontrolsystem.html" class="a">路径跟随控制系统<GydF4y2Ba/a><span role="cross_prod">（模型预测控制工具箱）<GydF4y2Ba/span>。<GydF4y2Ba/p> <div class="procedure"> <h3 class="title" id="TrainMultipleAgentsForPathFollowingControlExample-1">Overview</h3> <p>训练加固学习代理执行PFC的示例显示在<一个href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/ug/train-ddpg-agent-for-path-following-control.html" class="a">训练DDPG代理进行路径遵循控制<GydF4y2Ba/a>。在那个示例中，对单个深层确定性策略梯度（DDPG）代理进行了训练，以控制自我车辆的纵向速度和横向转向。在此示例中，您训练两个增强学习剂 - DDPG代理为纵向控制环提供连续的加速度值，并且深Q-NETWORK（DQN）代理为横向控制环提供了离散的转向角度值。<GydF4y2Ba/p> <p>The trained agents perform PFC through cooperative behavior and achieve satisfactory results.</p> <h3 class="title" id="TrainMultipleAgentsForPathFollowingControlExample-2">Create Environment</h3> <p>The environment for this example includes a simple bicycle model for the ego car and a simple longitudinal model for the lead car. The training goal is to make the ego car travel at a set velocity while maintaining a safe distance from lead car by controlling longitudinal acceleration and braking, while also keeping the ego car travelling along the centerline of its lane by controlling the front steering angle.</p> <p>加载环境参数。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>multiAgentPFCParams</pre> </div> </div> </div> <p>Open the Simulink model.</p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>mdl =<GydF4y2Baspan style="color:#A020F0">“ rlmultiagentpfc”<GydF4y2Ba/span>; open_system(mdl)</pre> </div> </div> </div> <div class="informalfigure"> <div id="d123e19868" class="mediaobject"> <p><img src="//www.tianjin-qmedu.com/fr/fr/help/examples/rl/win64/TrainMultipleAgentsForPathFollowingControlExample_01.png" alt="" height="578" width="1279" style="width: 1279px; height: 578px"></p> </div> </div> <p>In this model, the two reinforcement learning agents (RL Agent1 and RL Agent2) provide longitudinal acceleration and steering angle signals, respectively.</p> <p>The simulation terminates when any of the following conditions occur.</p> <div class="itemizedlist"> <ul> <li><p><span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mo stretchy="false"> |<GydF4y2Ba/mo> <msub> <mrow> <mi> e<GydF4y2Ba/mi> </mrow> <mrow> <mn> 1<GydF4y2Ba/mn> </mrow> </msub> <mo stretchy="false"> |<GydF4y2Ba/mo> <mo> ><GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> </mrow> </math></span>（横向偏差的大小超过1）<GydF4y2Ba/p></li> <li><p><span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <mi> v<GydF4y2Ba/mi> </mrow> <mrow> <mi> e<GydF4y2Ba/mi> <mi> G<GydF4y2Ba/mi> <mi> o<GydF4y2Ba/mi> </mrow> </msub> <mo> <<GydF4y2Ba/mo> <mn> 0<GydF4y2Ba/mn> <mo stretchy="false"> 。<GydF4y2Ba/mo> <mn> 5<GydF4y2Ba/mn> </mrow> </math></span>（（longitudinal velocity of the ego car drops below 0.5.</p></li> <li><p><span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <mi> d<GydF4y2Ba/mi> </mrow> <mrow> <mi> r<GydF4y2Ba/mi> <mi> e<GydF4y2Ba/mi> <mi> l<GydF4y2Ba/mi> </mrow> </msub> <mo> <<GydF4y2Ba/mo> <mn> 0<GydF4y2Ba/mn> </mrow> </math></span>（（distance between the ego and lead car is below zero)</p></li> </ul> </div> <p>Forthe longitudinal controller (RL Agent1):</p> <div class="itemizedlist"> <ul> <li><p>自我汽车的参考速度<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <mi> v<GydF4y2Ba/mi> </mrow> <mrow> <mi> r<GydF4y2Ba/mi> <mi> e<GydF4y2Ba/mi> <mi> F<GydF4y2Ba/mi> </mrow> </msub> </mrow> </math></span>is defined as follows. If the relative distance is less than the safe distance, the ego car tracks the minimum of the lead car velocity and driver-set velocity. In this manner, the ego car maintains some distance from the lead car. If the relative distance is greater than the safe distance, the ego car tracks the driver-set velocity. In this example, the safe distance is defined as a linear function of the ego car longitudinal velocity<span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mi mathvariant="italic"> v<GydF4y2Ba/mi> </mrow> </math></span>，，，，that is,<span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <mi> t<GydF4y2Ba/mi> </mrow> <mrow> <mi> G<GydF4y2Ba/mi> <mi> 一个<GydF4y2Ba/mi> <mi> p<GydF4y2Ba/mi> </mrow> </msub> <mo> *<GydF4y2Ba/mo> <mi> v<GydF4y2Ba/mi> <mo> +<GydF4y2Ba/mo> <msub> <mrow> <mi> d<GydF4y2Ba/mi> </mrow> <mrow> <mi> d<GydF4y2Ba/mi> <mi> e<GydF4y2Ba/mi> <mi> F<GydF4y2Ba/mi> <mi> 一个<GydF4y2Ba/mi> <mi> 你<GydF4y2Ba/mi> <mi> l<GydF4y2Ba/mi> <mi> t<GydF4y2Ba/mi> </mrow> </msub> </mrow> </math></span>。The safe distance determines the tracking velocity for the ego car.</p></li> <li><p>The observations from the environment contain the longitudinal measurements: the velocity error<span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <mi> e<GydF4y2Ba/mi> </mrow> <mrow> <mi> v<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <msub> <mrow> <mi> v<GydF4y2Ba/mi> </mrow> <mrow> <mi> r<GydF4y2Ba/mi> <mi> e<GydF4y2Ba/mi> <mi> F<GydF4y2Ba/mi> </mrow> </msub> <mo> -<GydF4y2Ba/mo> <mi> v<GydF4y2Ba/mi> </mrow> </math></span>，它的积分<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <mo stretchy="false"> ∫<GydF4y2Ba/mo> <mi> e<GydF4y2Ba/mi> </mrow> </math></span>，，，，一个nd the ego car longitudinal velocity<span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mi mathvariant="italic"> v<GydF4y2Ba/mi> </mrow> </math></span>。<GydF4y2Ba/p></li> <li><p>The action signal consists of continuous acceleration values between -3 and 2 m/s^2.</p></li> <li><p>The reward<span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true"> <msub> <mrow> <mi mathvariant="italic"> r<GydF4y2Ba/mi> </mrow> <mrow> <mi mathvariant="italic"> t<GydF4y2Ba/mi> </mrow> </msub> </math></span>，在每个时间步骤中提供<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mi mathvariant="italic"> t<GydF4y2Ba/mi> </mrow> </math></span>，，，，is</p></li> </ul> </div> <p></p> <div class="code_responsive"> <p class="programlistingindent"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <mi> r<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mo> -<GydF4y2Ba/mo> <mo stretchy="false"> （（<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> <mn> 0<GydF4y2Ba/mn> <msubsup> <mrow> <mi> e<GydF4y2Ba/mi> </mrow> <mrow> <mi> v<GydF4y2Ba/mi> </mrow> <mrow> <mn> 2<GydF4y2Ba/mn> </mrow> </msubsup> <mo> +<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> <mn> 0<GydF4y2Ba/mn> <mn> 0<GydF4y2Ba/mn> <msubsup> <mrow> <mi> 一个<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> <mo> -<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> </mrow> <mrow> <mn> 2<GydF4y2Ba/mn> </mrow> </msubsup> <mo stretchy="false"> ）<GydF4y2Ba/mo> <mo> ×</mo> <mn> 1<GydF4y2Ba/mn> <msup> <mrow> <mi> e<GydF4y2Ba/mi> </mrow> <mrow> <mo> -<GydF4y2Ba/mo> <mn> 3<GydF4y2Ba/mn> </mrow> </msup> <mo> -<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> <mn> 0<GydF4y2Ba/mn> <msub> <mrow> <mi> F<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> </mrow> </msub> <mo> +<GydF4y2Ba/mo> <msub> <mrow> <mi> m<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> </mrow> </msub> </mrow> </math></p> </div> <p></p> <p>这里，<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> 一个<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> <mo> -<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> </mrow> </msub> </mrow> </math></span>is the acceleration input from the previous time step, and:</p> <div class="itemizedlist"> <ul> <li><p><span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> F<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> </mrow> </math></span>if the simulation is terminated, otherwise<span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> F<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mn> 0<GydF4y2Ba/mn> </mrow> </math></span>。<GydF4y2Ba/p></li> <li><p><span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> m<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> </mrow> </math></span>if<span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msubsup> <mrow> <mi> e<GydF4y2Ba/mi> </mrow> <mrow> <mi> v<GydF4y2Ba/mi> </mrow> <mrow> <mn> 2<GydF4y2Ba/mn> </mrow> </msubsup> <mo> <<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> </mrow> </math></span>，否则<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> m<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mn> 0<GydF4y2Ba/mn> </mrow> </math></span>。<GydF4y2Ba/p></li> </ul> </div> <p>Forthe lateral controller (RL Agent2):</p> <div class="itemizedlist"> <ul> <li><p>来自环境的观察结果包含横向测量：横向偏差<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi mathvariant="italic"> e<GydF4y2Ba/mi> </mrow> <mrow> <mn> 1<GydF4y2Ba/mn> </mrow> </msub> </mrow> </math></span>，相对偏航角<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi mathvariant="italic"> e<GydF4y2Ba/mi> </mrow> <mrow> <mn> 2<GydF4y2Ba/mn> </mrow> </msub> </mrow> </math></span>，，，，their derivatives<span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <munderover accent="true"> <mrow> <mi> e<GydF4y2Ba/mi> </mrow> <mrow></mrow> <mrow> <mo stretchy="false"> ˙</mo> </mrow> </munderover> </mrow> <mrow> <mn> 1<GydF4y2Ba/mn> </mrow> </msub> </mrow> </math></span>一个nd<span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <munderover accent="true"> <mrow> <mi> e<GydF4y2Ba/mi> </mrow> <mrow></mrow> <mrow> <mo stretchy="false"> ˙</mo> </mrow> </munderover> </mrow> <mrow> <mn> 2<GydF4y2Ba/mn> </mrow> </msub> </mrow> </math></span>，以及他们的积分<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mrow> <mo> ∫<GydF4y2Ba/mo> <mrow> <msub> <mrow> <mi mathvariant="italic"> e<GydF4y2Ba/mi> </mrow> <mrow> <mn> 1<GydF4y2Ba/mn> </mrow> </msub> </mrow> </mrow> </mrow> </math></span>一个nd<span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mo> ∫<GydF4y2Ba/mo> <msub> <mrow> <mi mathvariant="italic"> e<GydF4y2Ba/mi> </mrow> <mrow> <mn> 2<GydF4y2Ba/mn> </mrow> </msub> </mrow> </math></span>。<GydF4y2Ba/p></li> <li><p>动作信号由离散的转向角度组成，该动作的值从-15度（-0.2618 rad）到15度（0.2618 RAD），步骤为1度（0.0175 RAD）。<GydF4y2Ba/p></li> <li><p>The reward<span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true"> <msub> <mrow> <mi mathvariant="italic"> r<GydF4y2Ba/mi> </mrow> <mrow> <mi mathvariant="italic"> t<GydF4y2Ba/mi> </mrow> </msub> </math></span>，在每个时间步骤中提供<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <mi mathvariant="italic"> t<GydF4y2Ba/mi> </mrow> </math></span>，，，，is</p></li> </ul> </div> <p></p> <div class="code_responsive"> <p class="programlistingindent"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <mi> r<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mo> -<GydF4y2Ba/mo> <mo stretchy="false"> （（<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> <mn> 0<GydF4y2Ba/mn> <mn> 0<GydF4y2Ba/mn> <msubsup> <mrow> <mi> e<GydF4y2Ba/mi> </mrow> <mrow> <mn> 1<GydF4y2Ba/mn> </mrow> <mrow> <mn> 2<GydF4y2Ba/mn> </mrow> </msubsup> <mo> +<GydF4y2Ba/mo> <mn> 5<GydF4y2Ba/mn> <mn> 0<GydF4y2Ba/mn> <mn> 0<GydF4y2Ba/mn> <msubsup> <mrow> <mi> 你<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> <mo> -<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> </mrow> <mrow> <mn> 2<GydF4y2Ba/mn> </mrow> </msubsup> <mo stretchy="false"> ）<GydF4y2Ba/mo> <mo> ×</mo> <mn> 1<GydF4y2Ba/mn> <msup> <mrow> <mi> e<GydF4y2Ba/mi> </mrow> <mrow> <mo> -<GydF4y2Ba/mo> <mn> 3<GydF4y2Ba/mn> </mrow> </msup> <mo> -<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> <mn> 0<GydF4y2Ba/mn> <msub> <mrow> <mi> F<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> </mrow> </msub> <mo> +<GydF4y2Ba/mo> <mn> 2<GydF4y2Ba/mn> <msub> <mrow> <mi> H<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> </mrow> </msub> </mrow> </math></p> </div> <p></p> <p>这里，<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="block"> <mrow> <msub> <mrow> <mi> 你<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> <mo> -<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> </mrow> </msub> </mrow> </math></span>是前一个时间步的转向输入，<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> 一个<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> <mo> -<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> </mrow> </msub> </mrow> </math></span>is the acceleration input from the previous time step, and:</p> <div class="itemizedlist"> <ul> <li><p><span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> F<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> </mrow> </math></span>if the simulation is terminated, otherwise<span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> F<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mn> 0<GydF4y2Ba/mn> </mrow> </math></span>。<GydF4y2Ba/p></li> <li><p><span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> H<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mn> 1<GydF4y2Ba/mn> <mtext></mtext> </mrow> </math></span><span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msubsup> <mrow> <mi> e<GydF4y2Ba/mi> </mrow> <mrow> <mn> 1<GydF4y2Ba/mn> </mrow> <mrow> <mn> 2<GydF4y2Ba/mn> </mrow> </msubsup> <mo> <<GydF4y2Ba/mo> <mn> 0<GydF4y2Ba/mn> <mo stretchy="false"> 。<GydF4y2Ba/mo> <mn> 0<GydF4y2Ba/mn> <mn> 1<GydF4y2Ba/mn> <mtext></mtext> </mrow> </math></span>，否则<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> H<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> </mrow> </msub> <mo> =<GydF4y2Ba/mo> <mn> 0<GydF4y2Ba/mn> <mtext></mtext> </mrow> </math></span>。<GydF4y2Ba/p></li> </ul> </div> <p>The logical terms in the reward functions (<span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> F<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> </mrow> </msub> </mrow> </math></span>，，，，<GydF4y2Baspan class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> m<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> </mrow> </msub> </mrow> </math></span>，，，，一个nd<span class="inlineequation"> <math xmlns="http://www.w3.org/1998/Math/MathML" xmlns:mwmmlx="//www.tianjin-qmedu.com/namespace/MathMLextensions" mwmmlx:extension="true" display="inline"> <mrow> <msub> <mrow> <mi> H<GydF4y2Ba/mi> </mrow> <mrow> <mi> t<GydF4y2Ba/mi> </mrow> </msub> </mrow> </math></span>）penalize the agents if the simulation terminates early, while encouraging the agents to make both the lateral error and velocity error small.</p> <p>Create the observation and action specifications for longitudinal control loop.</p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>obsInfo1 = rlNumericSpec([3 1]); actInfo1 = rlNumericSpec([1 1],<span style="color:#A020F0">“下限”<GydF4y2Ba/span>，，，，-3，，，，<GydF4y2Baspan style="color:#A020F0">“上限”<GydF4y2Ba/span>，，，，2）;</pre> </div> </div> </div> <p>Create the observation and action specifications for lateral control loop.</p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>obsInfo2 = rlNumericSpec([6 1]); actInfo2 = rlFiniteSetSpec((-15:15)*pi/180);</pre> </div> </div> </div> <p>结合观察和操作规范一个s a cell array.</p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>obsinfo = {obsinfo1，obsinfo2};actinfo = {actinfo1，actinfo2};<GydF4y2Ba/pre> </div> </div> </div> <p>创建一个Simul万博1manbetxink环境接口，指定两个代理块的块路径。块路径的顺序必须匹配观察和动作规范单元格数组的顺序。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>blks = mdl + [<GydF4y2Baspan style="color:#A020F0">“/RL代理1”<GydF4y2Ba/span>，，，，<GydF4y2Baspan style="color:#A020F0">“/RL代理2”<GydF4y2Ba/span>];env = rl万博1manbetxSimulinkenv（MDL，Blks，obsinfo，actinfo）;<GydF4y2Ba/pre> </div> </div> </div> <p>使用该环境指定重置函数<GydF4y2Bacode class="literal">ResetFcn</code>property. The function<code class="literal">pFcResetFcn</code>r一个ndomly sets the initial poses of the lead and ego vehicles at the beginning of every episode during training.</p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>env.Resetfcn = @pfcresetfcn;<GydF4y2Ba/pre> </div> </div> </div> <h3 class="title" id="TrainMultipleAgentsForPathFollowingControlExample-3">创建代理<GydF4y2Ba/h3> <p>Forthis example you create two reinforcement learning agents. First, fix the random seed for reproducibility.</p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>RNG（0）<GydF4y2Ba/pre> </div> </div> </div> <p>在此示例中，两种代理在相同的样本时间运行。设置样本时间值（以秒为单位）。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>TS = 0.1;<GydF4y2Ba/pre> </div> </div> </div> <h4 class="title" id="TrainMultipleAgentsForPathFollowingControlExample-4">Longitudinal Control</h4> <p>纵向控制回路的代理是DDPG代理。DDPG代理在使用评论家价值函数表示的观察和动作的情况下近似长期奖励，并使用Actor策略表示选择动作。有关创建深神网络价值功能和策略表示的更多信息，请参见<一个href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/ug/create-policy-and-value-function-representations.html" class="a">创建策略和价值功能表示<GydF4y2Ba/a>。<GydF4y2Ba/p> <p>使用<GydF4y2Bacode class="literal">createCCAgent</code>F你nction to create a DDPG agent for longitudinal control. The structure of this agent is similar to the<一个href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/ug/train-ddpg-agent-for-adaptive-cruise-control.html" class="a">Train DDPG Agent for Adaptive Cruise Control</a>example.</p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>Agent1 = createAccagent（obsinfo1，actinfo1，ts）;<GydF4y2Ba/pre> </div> </div> </div> <h4 class="title" id="TrainMultipleAgentsForPathFollowingControlExample-5">Lateral Control</h4> <p>横向控制环的代理是DQN代理。DQN代理在使用评论家价值函数表示的观察结果和行动给定的情况下近似长期奖励。<GydF4y2Ba/p> <p>使用<GydF4y2Bacode class="literal">Createlkaagent<GydF4y2Ba/code>F你nction to create a DQN agent for lateral control. The structure of this agent is similar to the<一个href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/ug/train-dqn-agent-for-lane-keeping-assist.html" class="a">Train DQN Agent for Lane Keeping Assist</a>example.</p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>一个Gent2 = createLKAAgent(obsInfo2,actInfo2,Ts);</pre> </div> </div> </div> <h3 class="title" id="TrainMultipleAgentsForPathFollowingControlExample-6">Train Agents</h3> <p>指定培训选项。对于此示例，请使用以下选项。<GydF4y2Ba/p> <div class="itemizedlist"> <ul> <li><p>Run each training episode for at most 5000 episodes, with each episode lasting at most<code class="literal">maxsteps</code>time steps.</p></li> <li><p>在“情节经理”对话框中显示培训进度（设置<GydF4y2Bacode class="literal">verbose</code>一个nd<code class="literal">Plots</code>options).</p></li> <li><p>当平均奖励分别大于480和1195时，停止培训DDPG和DQN代理。当一个代理商达到其停止标准时，它会在不学习的情况下模拟其自己的政策，而另一代代理继续培训。<GydF4y2Ba/p></li> </ul> </div> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>Tf = 60;<span style="color:#228B22">% simulation time</span>maxepisodes = 5000; maxsteps = ceil(Tf/Ts); trainingOpts = rlTrainingOptions(<span style="color:#0000FF">...<GydF4y2Ba/span><span style="color:#A020F0">'MaxEpisodes'</span>，maxepisodes，<GydF4y2Baspan style="color:#0000FF">...<GydF4y2Ba/span><span style="color:#A020F0">'MaxStepsPerEpisode'</span>，，，，maxsteps,<span style="color:#0000FF">...<GydF4y2Ba/span><span style="color:#A020F0">'Verbose'</span>，，，，F一个lse,<span style="color:#0000FF">...<GydF4y2Ba/span><span style="color:#A020F0">“绘图”<GydF4y2Ba/span>，，，，<GydF4y2Baspan style="color:#A020F0">“训练过程”<GydF4y2Ba/span>，，，，<GydF4y2Baspan style="color:#0000FF">...<GydF4y2Ba/span><span style="color:#A020F0">“停止训练有素”<GydF4y2Ba/span>，，，，<GydF4y2Baspan style="color:#A020F0">'AverageReward'</span>，，，，<GydF4y2Baspan style="color:#0000FF">...<GydF4y2Ba/span><span style="color:#A020F0">'StopTrainingValue'</span>，[480,1195]）;<GydF4y2Ba/pre> </div> </div> </div> <p>Train the agents using the<一个href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/ref/rl.agent.rlqagent.train.html" class="a"><code class="olink">火车<GydF4y2Ba/code></a>F你nction. Training these agents is a computationally intensive process that takes several minutes to complete. To save time while running this example, load a pretrained agent by setting<code class="literal">doTraining</code>至<GydF4y2Bacode class="literal">F一个lse</code>。To train the agent yourself, set<code class="literal">doTraining</code>至<GydF4y2Bacode class="literal">tr你e<GydF4y2Ba/code>。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>doTraining = false;<span style="color:#0000FF">if</span>doTraining<span style="color:#228B22">％训练代理。<GydF4y2Ba/span>火车ingStats = train([agent1,agent2],env,trainingOpts);<span style="color:#0000FF">else</span><span style="color:#228B22">% Load pretrained agents for the example.</span>加载（<GydF4y2Baspan style="color:#A020F0">'rlpfcagents.mat'<GydF4y2Ba/span>）<GydF4y2Baspan style="color:#0000FF">end</span></pre> </div> </div> </div> <p>The following figure shows a snapshot of the training progress for the two agents.</p> <div class="informalfigure"> <div id="d123e20539" class="mediaobject"> <p><img src="//www.tianjin-qmedu.com/fr/fr/help/examples/rl/win64/TrainMultipleAgentsForPathFollowingControlExample_02.png" alt="" height="720" width="1160" style="width: 1160px; height: 720px"></p> </div> </div> <h3 class="title" id="TrainMultipleAgentsForPathFollowingControlExample-7">Simulate Agents</h3> <p>为了验证受过训练的代理的性能，请通过删除以下命令来模拟Simulink环境中的代理。万博1manbetx有关代理模拟的更多信息，请参阅<一个href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/ref/rlsimulationoptions.html" class="a"><code class="olink">rlSimulationOptions</code></a>一个nd<一个href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/ref/rl.env.abstractenv.sim.html" class="a"><code class="olink">sim</code></a>。<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre><span style="color:#228B22">％simOptions = rlSimulationOptions（'MaxSteps'，MaxSteps）;<GydF4y2Ba/span><span style="color:#228B22">% experience = sim(env,[agent1, agent2],simOptions);</span></pre> </div> </div> </div> <p>要使用确定性初始条件演示训练的代理，请在Simulink中模拟该模型。万博1manbetx<GydF4y2Ba/p> <div class="code_responsive"> <div class="programlisting"> <div class="codeinput"> <pre>e1_initial = -0.4; e2_initial = 0.1; x0_lead = 80; sim(mdl)</pre> </div> </div> </div> <p>The following plots show the results when the lead car is 70 m ahead of the ego car at the beginning of simulation.</p> <div class="itemizedlist"> <ul> <li><p>The lead car changes speed from 24 m/s to 30 m/s periodically (top-right plot). The ego car maintains a safe distance throughout the simulation (bottom-right plot).</p></li> <li><p>从0到30秒，自我汽车跟踪设定速度（最高右图）并经历了一些加速度（左上图）。之后，加速度降低到0。<GydF4y2Ba/p></li> <li><p>左下图显示横向偏差。如图所示，横向偏差在1秒内大大减少。横向偏差保持小于0.1 m。<GydF4y2Ba/p></li> </ul> </div> <p><span class="guiicon"><span class="inlinemediaobject"><img src="//www.tianjin-qmedu.com/fr/fr/help/examples/rl/win64/TrainMultipleAgentsForPathFollowingControlExample_03.png" alt="" height="398" width="579" style="width: 579px; height: 398px"></span></span><span class="guiicon"><span class="inlinemediaobject"><img src="//www.tianjin-qmedu.com/fr/fr/help/examples/rl/win64/TrainMultipleAgentsForPathFollowingControlExample_04.png" alt="" height="399" width="617" style="width: 617px; height: 399px"></span></span></p> <p><span class="guiicon"><span class="inlinemediaobject"><img src="//www.tianjin-qmedu.com/fr/fr/help/examples/rl/win64/TrainMultipleAgentsForPathFollowingControlExample_05.png" alt="" height="381" width="580" style="width: 580px; height: 381px"></span></span><span class="guiicon"><span class="inlinemediaobject"><img src="//www.tianjin-qmedu.com/fr/fr/help/examples/rl/win64/TrainMultipleAgentsForPathFollowingControlExample_06.png" alt="" height="381" width="616" style="width: 616px; height: 381px"></span></span></p> </div> <h2 id="d123e20586">也可以看看<GydF4y2Ba/h2> <p><span itemscope itemtype="//www.tianjin-qmedu.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso"><a itemprop="url" href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/ref/rl.agent.rlqagent.train.html"><span itemprop="name"><code class="function">火车<GydF4y2Ba/code></span></a></span>|<GydF4y2Baspan itemscope itemtype="//www.tianjin-qmedu.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso"><a itemprop="url" href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/ref/rlsimulinkenv.html"><span itemprop="name"><code class="olink">rl万博1manbetxsimulinkenv<GydF4y2Ba/code></span></a></span></p> <h2 id="d123e20594">Related Topics</h2> <ul> <li><a href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/ug/train-reinforcement-learning-agents.html" class="a">训练加强学习者<GydF4y2Ba/a></li> </ul> </section> </div> <div class="modal fade" id="open-example-dialog" tabindex="-1" role="dialog" aria-labelledby="openExampleDialogLabel" aria-hidden="true"> <div class="modal-dialog"> <div class="modal-content"> <div class="modal-header"> <button type="button" class="close" data-dismiss="modal" aria-label="Close"><span aria-hidden="true">×</span></button> <h2 class="modal-title">Ouvrir l'exemple</h2> </div> <div class="modal-body" id="dialog-body"> <p>vouspossédezune版本modifiéedecet典范。souhaitez-vous ouvrir cet典范AVEC VOS修改？<GydF4y2Ba/p> </div> <div class="modal-footer"> <a id="open-example-dialog-replace" class="btn btn_color_blue companion_btn" data-dismiss="modal">Non, écraser la version modifiée</a> <a id="open-example-dialog-continue" class="btn btn_color_blue" data-dismiss="modal">Oui</a> </div> </div> </div> </div> <div class="clearfix"></div> <div align="center" class="feedbackblock"> <iframe id="doc_survey"></iframe> </div> </section> <div class="modal fade" id="matlab-command-dialog" tabindex="-1" role="dialog" aria-labelledby="matlabCommandDialogLabel" aria-hidden="true"> <div class="modal-dialog"> <div class="modal-content"> <div class="modal-header"> <button type="button" class="close" data-dismiss="modal" aria-label="Close"><span aria-hidden="true">×</span></button> <h2 class="modal-title">Commande MATLAB</h2> </div> <div class="modal-body" id="dialog-body"> <p>vo你s avez cliqué sur un lien qui correspond à cette commande MATLAB :</p> <pre id="dialog-matlab-command"></pre> <p>倒实行la对saisissez-la在铁nêtre de commande de MATLAB. Les navigateurs web ne supportent pas les commandes MATLAB.</p> </div> <div class="modal-footer"> <button type="button" class="btn btn_secondary" data-dismiss="modal">费默<GydF4y2Ba/button> </div> </div> </div> </div> <div id="location_content" style="display:none;"></div> <div class="modal fade" id="country-unselected" tabindex="-1" role="dialog" aria-labelledby="country-unselected-title" translate="no"> <div id="country-select-container"> <div class="modal-dialog modal-lg"> <div class="modal-content"> <div class="modal-header"> <button type="button" class="close" data-dismiss="modal" aria-label="Close"><span aria-hidden="true">×</span></button> <img alt="数学工作GydF4y2Ba" src="//www.tianjin-qmedu.com/fr/images/responsive/global/pic-header-mathworks-logo2.svg" style="width:167px; height:auto;"> </div> <div class="modal-body"> <div class="row add_margin_40"> <div class="col-xs-12"> <h1 class="icon-globe icon_color_secondary" id="country-unselected-title">选择一个Web Site</h1> <p>选择一个网站以获取可用的翻译内容，并查看本地事件和优惠。根据您的位置，我们建议您选择：<GydF4y2Bastrong class="recommended-country"></strong>。<GydF4y2Ba/p> <a href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#" id="recommended_domain_button" class="btn btn_color_blue containsResourceName resourceClass-button">选择<GydF4y2Baspan class="recommended-country"></span>web site</a> </div> </div> <p>You can also select a web site from the following list:</p> <div class="alert alert-warning" id="china_performance_alert" style="display:none;"> <span class="alert_icon icon-alert-warning"></span> <h2>如何获得最佳网站性能<GydF4y2Ba/h2> <p>选择中国网站（中文或英语）以获得最佳场地性能。其他Mathworks乡村网站未针对您所在的访问进行优化。<GydF4y2Ba/p> </div> <div class="row add_margin_30"> <div class="col-sm-4 col-md-3"> <h3 class="add_bottom_rule">Americas</h3> <ul class="list-unstyled"> <li><a href="//www.tianjin-qmedu.com/la" class="domain_selector_link" data-country-code="LA" data-subdomain="la" data-lang="es" data-default-lang="true" data-selected-text="América Latina" data-recommended-text="América Latina" data-do-not-rewrite="true">América Latina</a>（（Español)</li> <li><a href="//www.tianjin-qmedu.com/fr/" class="domain_selector_link" data-country-code="CA" data-subdomain="www" data-lang="en" data-do-not-rewrite="true">Canada</a>（（English)</li> <li><a href="//www.tianjin-qmedu.com/fr/" class="domain_selector_link" data-country-code="US" data-subdomain="www" data-lang="en" data-default-lang="true" data-selected-text="United States" data-recommended-text="United States" data-do-not-rewrite="true">United States</a>（（English)</li> </ul> </div> <div class="col-sm-4 col-md-6"> <h3 class="add_bottom_rule">Europe</h3> <div class="row"> <div class="col-xs-6 col-sm-12 col-md-6"> <ul class="list-unstyled add_margin_0_sm"> <li><a href="//www.tianjin-qmedu.com/nl" class="domain_selector_link" data-country-code="BE" data-subdomain="nl" data-lang="en" data-do-not-rewrite="true">Belgium</a>（（English)</li> <li><a href="//www.tianjin-qmedu.com/se" class="domain_selector_link" data-country-code="DK" data-subdomain="se" data-lang="en" data-do-not-rewrite="true">denmark</a>（（English)</li> <li><a href="//www.tianjin-qmedu.com/de" class="domain_selector_link" data-country-code="DE" data-subdomain="de" data-lang="de" data-default-lang="true" data-selected-text="Deutschland" data-recommended-text="Deutschland" data-do-not-rewrite="true">德国<GydF4y2Ba/a>（（de你tsch)</li> <li><a href="//www.tianjin-qmedu.com/es" class="domain_selector_link" data-country-code="ES" data-subdomain="es" data-lang="es" data-default-lang="true" data-selected-text="España" data-recommended-text="España" data-do-not-rewrite="true">España</a>（（Español)</li> <li><a href="//www.tianjin-qmedu.com/se" class="domain_selector_link" data-country-code="FI" data-subdomain="se" data-lang="en" data-do-not-rewrite="true">芬兰<GydF4y2Ba/a>（（English)</li> <li><a href="//www.tianjin-qmedu.com/fr/" class="domain_selector_link" data-country-code="FR" data-subdomain="fr" data-lang="fr" data-default-lang="true" data-selected-text="France" data-recommended-text="France" data-do-not-rewrite="true">Fr一个nce</a>（Français）<GydF4y2Ba/li> <li><a href="//www.tianjin-qmedu.com/uk" class="domain_selector_link" data-country-code="IE" data-subdomain="uk" data-lang="en" data-do-not-rewrite="true">Ireland</a>（（English)</li> <li><a href="//www.tianjin-qmedu.com/it" class="domain_selector_link" data-country-code="IT" data-subdomain="it" data-lang="it" data-default-lang="true" data-selected-text="Italia" data-recommended-text="Italia" data-do-not-rewrite="true">Italia</a>（（Italiano)</li> <li><a href="//www.tianjin-qmedu.com/nl" class="domain_selector_link" data-country-code="LU" data-subdomain="nl" data-lang="en" data-do-not-rewrite="true">卢森堡<GydF4y2Ba/a>（（English)</li> </ul> </div> <div class="col-xs-6 col-sm-12 col-md-6"> <ul class="list-unstyled"> <li><a href="//www.tianjin-qmedu.com/nl" class="domain_selector_link" data-country-code="NL" data-subdomain="nl" data-lang="en" data-default-lang="true" data-selected-text="Benelux" data-recommended-text="Netherlands" data-do-not-rewrite="true">Netherlands</a>（（English)</li> <li><a href="//www.tianjin-qmedu.com/se" class="domain_selector_link" data-country-code="NO" data-subdomain="se" data-lang="en" data-do-not-rewrite="true">Norway</a>（（English)</li> <li><a href="//www.tianjin-qmedu.com/de" class="domain_selector_link" data-country-code="AT" data-subdomain="de" data-lang="de" data-do-not-rewrite="true">Österreich<GydF4y2Ba/a>（（de你tsch)</li> <li><a href="//www.tianjin-qmedu.com/fr/" class="domain_selector_link" data-country-code="PT" data-subdomain="www" data-lang="en" data-do-not-rewrite="true">Portugal</a>（（English)</li> <li><a href="//www.tianjin-qmedu.com/se" class="domain_selector_link" data-country-code="Sweden" data-subdomain="se" data-lang="en" data-default-lang="true" data-selected-text="Nordic" data-recommended-text="Sweden" data-do-not-rewrite="true">瑞典<GydF4y2Ba/a>（（English)</li> <li>Switzerland<你lclass="list-unstyled add_indent_20"> <li><a href="//www.tianjin-qmedu.com/ch" class="domain_selector_link" data-country-code="CH" data-subdomain="ch" data-lang="de" data-selected-text="Schweiz" data-recommended-text="Schweiz" data-do-not-rewrite="true">de你tsch</a></li> <li><a href="//www.tianjin-qmedu.com/ch" id="swiss_english" class="domain_selector_link" data-country-code="CH" data-subdomain="ch" data-lang="en" data-default-lang="true" data-selected-text="Switzerland" data-recommended-text="Switzerland" data-do-not-rewrite="true">English</a></li> <li><a href="//www.tianjin-qmedu.com/ch" class="domain_selector_link" data-country-code="CH" data-subdomain="ch" data-lang="fr" data-selected-text="Suisse" data-recommended-text="Suisse" data-do-not-rewrite="true">弗朗索瓦人<GydF4y2Ba/a></li> </ul></li> <li><a href="//www.tianjin-qmedu.com/uk" class="domain_selector_link" data-country-code="GB" data-subdomain="uk" data-lang="en" data-default-lang="true" data-selected-text="United Kingdom" data-recommended-text="United Kingdom" data-do-not-rewrite="true">United Kingdom</a>（（English)</li> </ul> </div> </div> </div> <div class="col-sm-4 col-md-3"> <h3 class="add_bottom_rule">Asia Pacific</h3> <ul class="list-unstyled"> <li><a href="//www.tianjin-qmedu.com/au" class="domain_selector_link" data-country-code="AU" data-subdomain="au" data-lang="en" data-default-lang="true" data-selected-text="Australia" data-recommended-text="Australia" data-do-not-rewrite="true">澳大利亚<GydF4y2Ba/a>（（English)</li> <li><a href="//www.tianjin-qmedu.com/in" class="domain_selector_link" data-country-code="IN" data-subdomain="in" data-lang="en" data-default-lang="true" data-selected-text="India" data-recommended-text="India" data-do-not-rewrite="true">India</a>（（English)</li> <li><a href="//www.tianjin-qmedu.com/au" class="domain_selector_link" data-country-code="NZ" data-subdomain="au" data-lang="en" data-do-not-rewrite="true">New Zealand</a>（（English)</li> <li>中国<你lclass="list-unstyled add_indent_20"> <li><a href="https://ww2.mathworks.cn" class="domain_selector_link" data-country-code="CN" data-subdomain="ww2" data-lang="zh" data-default-lang="true" data-selected-text="中国" data-recommended-text="中国" data-do-not-rewrite="true">简体中文</a></li> <li><a href="https://ww2.mathworks.cn" class="domain_selector_link" data-country-code="CN" data-subdomain="ww2" data-lang="en" data-default-lang="true" data-selected-text="China" data-recommended-text="China" data-do-not-rewrite="true">English</a></li> </ul></li> <li><a href="//www.tianjin-qmedu.com/jp" class="domain_selector_link" data-country-code="JP" data-subdomain="jp" data-lang="ja" data-default-lang="true" data-selected-text="日本" data-recommended-text="日本" data-do-not-rewrite="true">日本</a>（（日本語)</li> <li><a href="//www.tianjin-qmedu.com/kr" class="domain_selector_link" data-country-code="KR" data-subdomain="kr" data-lang="ko" data-default-lang="true" data-selected-text="한국" data-recommended-text="한국" data-do-not-rewrite="true">한국</a>（（한국어)</li> </ul> </div> </div> <p class="text-center"><a href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#" class="worldwide_link">Contact your local office</a></p> </div> </div> </div> </div> </div> </div> </div> </div> </div>  <div class="cta_container_mobile visible-sm visible-xs"> <div class="container-fluid"> <div class="row"> <div class="col-xs-12"> <div class="cta_box"> <ul class="list-inline"> <li class="cta_item cta_item_general hidden-sm hidden-xs "><a href="//www.tianjin-qmedu.com/fr/campaigns/products/trials.html?prodcode=RL&s_iid=doc_trial_RL_tb" class="icon-download">Trials</a></li> <li class="hidden-lg hidden-md "><a href="//www.tianjin-qmedu.com/fr/campaigns/products/trials.html?prodcode=RL&s_iid=doc_trial_RL_tb" class="btn btn_color_blue btn-block"><span class="icon-download"></span>Trials</a></li> <li class="cta_item cta_item_general hidden-sm hidden-xs "><a href="//www.tianjin-qmedu.com/fr/support/web_downloads_bounce.html?s_cid=1008_degr_docdn_270055" class="icon-download">mises à jour du produit</a></li> <li class="hidden-lg hidden-md "><a href="//www.tianjin-qmedu.com/fr/support/web_downloads_bounce.html?s_cid=1008_degr_docdn_270055" class="btn btn_color_blue btn-block"><span class="icon-download"></span>mises à jour du produit</a></li> </ul> </div> </div> </div> </div> </div>   <div class="body_trail_container"> <div class="container-fluid"> <div class="row"> <div class="col-xs-12"> <div class="row"> <div class="col-xs-12 col-sm-4"> <h2><a href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/index.html?s_tid=doc_ftr">强化学习工具箱文档<GydF4y2Ba/a></h2> <ul class="list-unstyled hidden-xs"> <li><a href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/examples.html?s_tid=doc_ftr">Examples</a></li> <li><a href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/referencelist.html?type=function&s_tid=doc_ftr">功能一个nd Other Reference</a></li> <li><a href="//www.tianjin-qmedu.com/fr/fr/help/reinforcement-learning/release-notes.html?s_tid=doc_ftr">Release Notes</a></li> <li><a href="//www.tianjin-qmedu.com/fr/fr/help/pdf_doc/reinforcement-learning/index.html?s_tid=doc_ftr">PDF文档<GydF4y2Ba/a></li> </ul> </div> <div class="col-xs-12 col-sm-4"> <h2><a href="//www.tianjin-qmedu.com/fr/support.html?s_tid=doc_ftr">万博1manbetx</a></h2> <ul class="list-unstyled hidden-xs"> <li><a href="//www.tianjin-qmedu.com/fr/matlabcentral/answers/index?s_tid=doc_ftr">mATLAB Answers</a></li> <li><a href="//www.tianjin-qmedu.com/fr/help/install/?s_tid=doc_ftr">安装帮助<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/fr/support/bugreports/?s_tid=doc_ftr">Bug Reports</a></li> <li><a href="//www.tianjin-qmedu.com/fr/support/requirements/product-requirements-platform-availability-list.html?s_tid=doc_ftr">Product Requirements</a></li> <li><a href="//www.tianjin-qmedu.com/fr/downloads/?s_tid=doc_ftr">Software Downloads</a></li> </ul> </div> <div class="col-xs-12 col-sm-4"> <div class="panel panel_color_transparent panel_color_fill"> <div class="panel-body"> <div class="thumbnail add_margin_5"> <a href="//www.tianjin-qmedu.com/fr/campaigns/offers/reinforcement-learning-with-matlab-ebook.html?s_iid=doc_eb_RL_footer"><img class="fluid_image" alt="Reinforcement Learning with MATLAB and Simulink" src="//www.tianjin-qmedu.com/fr/content/dam/mathworks/mathworks-dot-com/images/responsive/supporting/campaigns/products/reinforcement-learning-ebook-offer-thumbnail.jpg"></a> </div> <h4><a href="//www.tianjin-qmedu.com/fr/campaigns/offers/reinforcement-learning-with-matlab-ebook.html?s_iid=doc_eb_RL_footer">Reinforcement Learning with MATLAB and Simulink</a></h4> <a class="icon-download" href="//www.tianjin-qmedu.com/fr/campaigns/offers/reinforcement-learning-with-matlab-ebook.html?s_iid=doc_eb_RL_footer">download ebook</a> </div> </div> </div> </div> </div> </div> </div> </div>  <footer id="footer" class="bs-footer">  <div class="container-fluid"> <div class="fat_footer_container"> <div class="fat_footer"> <div class="execmatlabweb">  <div class="row"> <div class="col-xs-12 col-md-12 col-lg-3 add_margin_20"> <p class="h4 add_margin_0"><span translate="no">数学工作<GydF4y2Ba/span></p> <p><em>Accelerating the pace of engineering and science</em></p> <p class="hidden-xs">数学工作est le leader mondial des logiciels de calcul mathématique pour les ingénieurs et les scientifiques.</p> <p class="hidden-xs"><a href="//www.tianjin-qmedu.com/fr/discovery.html?s_tid=all_disc_mw_ff">découvrir...</a></p> </div> <div class="col-xs-12 col-md-12 col-lg-9"> <div class="row"> <div class="col-xs-12 col-sm-2"> <p class="ff_section_title"><a href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#fatfooter_products" role="button" data-toggle="collapse" aria-expanded="false" aria-controls="fatfooter_products">découvrir les produits<span class="caret"></span></a></p> <div class="collapse" id="fatfooter_products"> <ul class="list-unstyled"> <li><a href="//www.tianjin-qmedu.com/fr/products/matlab.html?s_tid=hp_ff_p_matlab">mATLAB</a></li> <li><a href="//www.tianjin-qmedu.com/fr/products/simulink.html?s_tid=hp_ff_p_simulink">万博1manbetx</a></li> <li><a href="//www.tianjin-qmedu.com/fr/products/matlab/student.html?s_tid=hp_ff_p_student">version étudiante</a></li> <li><a href="//www.tianjin-qmedu.com/fr/hardware-support/home.html?s_tid=hp_ff_p_hwsupport">Support Hardware</a></li> <li><a href="//www.tianjin-qmedu.com/fr/matlabcentral/fileexchange/?s_tid=hp_ff_p_fx">文件交换<GydF4y2Ba/a></li> </ul> </div> </div> <div class="col-xs-12 col-sm-2"> <p class="ff_section_title"><a href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#fatfooter_buy" role="button" data-toggle="collapse" aria-expanded="false" aria-controls="fatfooter_buy">Essayer ou Acheter<span class="caret"></span></a></p> <div class="collapse" id="fatfooter_buy"> <ul class="list-unstyled"> <li><a href="//www.tianjin-qmedu.com/fr/downloads/web_downloads/?s_iid=hp_ff_t_downloads">Téléchargements</a></li> <li><a href="//www.tianjin-qmedu.com/fr/campaigns/products/trials.html?s_iid=hp_ff_p_trial">版本d'Essai<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/fr/company/aboutus/contact_us/contact_sales.html?s_iid=hp_ff_t_sales">Contact commercial</a></li> <li><a href="//www.tianjin-qmedu.com/fr/pricing-licensing.html?s_iid=hp_ff_t_pricing">Tarifs et licences</a></li> <li><a href="//www.tianjin-qmedu.com/fr/store/?s_tid=hp_ff_t_buy">Comment acheter</a></li> </ul> </div> </div> <div class="col-xs-12 col-sm-2"> <p class="ff_section_title"><a role="button" data-toggle="collapse" href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#fatfooter_use" aria-expanded="false" aria-controls="fatfooter_use">Se Former<span class="caret"></span></a></p> <div class="collapse" id="fatfooter_use"> <ul class="list-unstyled"> <li><a href="//www.tianjin-qmedu.com/fr/help/?s_tid=hp_ff_l_doc">文档<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/fr/support/learn-with-matlab-tutorials.html?s_tid=hp_ff_l_tutorials">Tutoriels</a></li> <li><a href="//www.tianjin-qmedu.com/fr/help/examples.html?s_tid=hp_ff_l_examples">Exemples</a></li> <li><a href="//www.tianjin-qmedu.com/fr/videos.html?s_tid=hp_ff_l_videos">vidéos et Webinars</a></li> <li><a href="//www.tianjin-qmedu.com/fr/services/training.html?s_tid=hp_ff_l_training">编队<GydF4y2Ba/a></li> </ul> </div> </div> <div class="clearfix" id="offcanvas_clearfix" style="display:none"></div> <div class="col-xs-12 col-sm-2"> <p class="ff_section_title"><a href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#fatfooter_support" role="button" data-toggle="collapse" aria-expanded="false" aria-controls="fatfooter_support">Obtenir de l'aide<span class="caret"></span></a></p> <div class="collapse" id="fatfooter_support"> <ul class="list-unstyled"> <li><a href="//www.tianjin-qmedu.com/fr/help/install/?s_tid=hp_ff_s_install">Aide à l'installation</a></li> <li><a href="//www.tianjin-qmedu.com/fr/matlabcentral/answers/index?s_tid=hp_ff_s_answers">MATLAB论坛<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/fr/services/consulting.html?s_tid=hp_ff_s_consulting">Services Consulting</a></li> <li><a href="//www.tianjin-qmedu.com/fr/licensecenter/?s_tid=hp_ff_s_license">Gestion Licences</a></li> <li><a href="//www.tianjin-qmedu.com/fr/support/contact_us.html?s_tid=hp_ff_s_support">Contacter l’assistance</a></li> </ul> </div> </div> <div class="col-xs-12 col-sm-2"> <p class="ff_section_title"><a role="button" data-toggle="collapse" href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#fatfooter_about" aria-expanded="false" aria-controls="fatfooter_about">La société<span class="caret"></span></a></p> <div class="collapse" id="fatfooter_about"> <ul class="list-unstyled"> <li><a href="//www.tianjin-qmedu.com/fr/company/jobs/opportunities.html?s_tid=hp_ff_a_careers">d'emploi<GydF4y2Ba/a></li> <li><a href="//www.tianjin-qmedu.com/fr/company/newsroom.html?s_tid=hp_ff_a_newsroom">Actualités</a></li> <li><a href="//www.tianjin-qmedu.com/fr/company/aboutus/soc_mission.html?s_tid=hp_ff_a_socialmission">Social Mission</a></li> <li><a href="//www.tianjin-qmedu.com/fr/company/aboutus/contact_us/contact_sales.html?s_tid=hp_ff_a_sales">Contact commercial</a></li> <li><a href="//www.tianjin-qmedu.com/fr/company.html?s_tid=hp_ff_a_company">La société</a></li> </ul> </div> </div> </div> </div> </div> </div> </div> </div> </div>  <div class="container-fluid"> <div class="footer" translate="no"> <div class="row"> <div class="col-xs-12 col-md-9"> <ul class="countrynav" id="countrynav"> <li class="footernav_country"><a href="//www.tianjin-qmedu.com/fr/help/reinforcement-learning/ug/#" data-toggle="modal" data-target="#country-unselected"><span class="icon-globe icon_color_quinary icon_16"></span>Fr一个nce</a></li> </ul> <div class="clearfix"></div> <ul class="footernav"> <li class="footernav_patents"><a href="//www.tianjin-qmedu.com/fr/company/aboutus/policies_statements/trust-center.html?s_tid=gf_tc">信任中心<GydF4y2Ba/a></li> <li class="footernav_trademarks"><a href="//www.tianjin-qmedu.com/fr/company/aboutus/policies_statements/trademarks.html?s_tid=gf_trd">m一个rques déposées</a></li> <li class="footernav_privacy"><a href="//www.tianjin-qmedu.com/fr/company/aboutus/policies_statements.html?s_tid=gf_priv">Charte de confidentialité</a></li> <li class="footernav_piracy"><a href="//www.tianjin-qmedu.com/fr/company/aboutus/policies_statements/piracy.html?s_tid=gf_pir">Preventing Piracy</a></li> <li class="footernav_status"><a href="//www.tianjin-qmedu.com/status/?s_tid=gf_application">Etat des applications</a></li> </ul> <div class="clearfix"></div> <div class="clearfix"></div> <p class="copyright" translate="no">© 1994-2021 The MathWorks, Inc.</p> </div> <div class="clearfix visible-sm add_margin_10"></div> <div class="col-xs-12 col-md-3"> <div class="social_media"> <ul class="social_media_icons"> <li><a href="https://www.facebook.com/MATLAB" target="_blank" rel="nofollow noopener noreferrer" class="svg_link"><img src="//www.tianjin-qmedu.com/fr/images/responsive/global/ico-facebook.svg" alt="F一个cebook" class="ico_facebook"></a></li> <li><a href="https://www.twitter.com/MATLAB" target="_blank" rel="nofollow noopener noreferrer" class="svg_link"><img src="//www.tianjin-qmedu.com/fr/images/responsive/global/ico-twitter.svg" alt="Twitter" class="ico_twitter"></a></li> <li><a href="https://www.instagram.com/matlab/" class="svg_link" target="_blank" rel="nofollow noopener noreferrer"><img class="ico_instagram" alt="InstagramGydF4y2Ba" src="//www.tianjin-qmedu.com/fr/etc.clientlibs/mathworks/clientlibs/customer-ui/templates/common/resources/images/ico-instagram.svg"></a></li> <li><a href="https://www.youtube.com/user/MATLAB" class="svg_link" target="_blank" rel="nofollow noopener noreferrer"><img class="ico_youtube" alt="YouTube" src="//www.tianjin-qmedu.com/fr/images/responsive/global/ico-youtube.svg"></a></li> <li><a href="https://www.linkedin.com/company/the-mathworks_2" target="_blank" rel="nofollow noopener noreferrer" class="svg_link"><img src="//www.tianjin-qmedu.com/fr/images/responsive/global/ico-linkedin.svg" alt="LinkedInGydF4y2Ba" class="ico_linkedin"></a></li> <li><a href="//www.tianjin-qmedu.com/fr/company/rss.html" class="svg_link"><img src="//www.tianjin-qmedu.com/fr/images/responsive/global/ico-rss.svg" alt="RSSGydF4y2Ba" class="ico_rss"></a></li> </ul> <div class="clearfix"></div> <p><em>Rejoignez la对话<GydF4y2Ba/em></p> </div> </div> </div> </div> <div id="cookie-banner-text" style="display:none;"> This website uses cookies to improve your user experience, personalize content and ads, and analyze website traffic. By continuing to use this website, you consent to our use of cookies. Please see our<一个href="//www.tianjin-qmedu.com/fr/company/aboutus/policies_statements.html">Privacy Policy</a>至le一个rn more about cookies and how to change your settings.</div> </div> </footer> </div> </div>  </body> </html>