深度学习

强化学习

深度强化学习是机器学习的一个分支'implémenter des contrôleurs et des systèmes décisionnels pour des systèmes complex comme les robots ou les véhicules autonomes。深度强化学习您可以浏览'implémenter des réseaux de neurones provant des comportements complex en basant leur tissage sur données générées dynamiquà partir de modèles de simulation。你们不可以在这里学习données d' apprentice tisage prédéfini, labélisé不可以,可以在modèle d' simulation représentatif d' envirment和你们的学习水平相等你们可以在contrôler学习。

用MATLAB®,仿万博1manbetx真软件®强化学习工具箱™你们可以在déploiement d’un système décisionnel的设计工作流程中学习。你们可以:

  • 你们可以在强化学习中学习systèmes contrôle simple, systèmes autonomes和robotique的例子
  • Évaluer等算法的普及,加强学习,通过快速的,à,其他的修改,à apporter au代码
  • Utiliser des réseaux de neurones pour définir des politiques de Reinforcement Learning complex basées sur des images, des vidéos et des données de capteurs
  • Accélérer l ' tissage des politiques en exécutant plusieurs emulation en parallèle en utilisant des cœurs en local ou dans le cloud
  • Déployer des contrôleurs de Reinforcement Learning sur des dispositifs embarqués

Les agents du Reinforcement Learning

强化学习的代理们在état en entrée和一次行动中了解一种政策,因为我们的算法对这项计划负责à jour de cette politique。深度q -网络、行动者-评论家和深度确定性政策梯度是流行算法的范例。算法遇见à jour la politique façon à最大化récompense关于长期环境的信号。

Les politiques peuvent être représentées par des réseaux de neurones profond, des polynômes和查找表。您可以使用implémenter代理prédéfinis您可以使用personnalisés对象MATLAB和Simulink。万博1manbetx

在知道+

Modéliser环境通过MATLAB和Simulink实现万博1manbetx

强化学习算法的学习是一个动态过程,在主体与环境交互的过程中。Pour des applications come la robotique et les systèmes autonomes, il peut s 'avérer coûteux et dangereux de réaliser cet entraînement dans des conditions réelles avec du véritable hardware。这是强化学习的基础,主要内容是préférable de générer des données通过des modèles virtuels représentatifs de l ' environment进行模拟。

你们可以在MATLAB和Simulink中下载créer un modèle de votre环境,在MATLAB和Simulink万博1manbetx中下载décrit la dynamique du système,行动的影响réalisées par l 'agent和une récompense qui évalue le bien-fondé de l 'action réalisée。Ces modèles peuvent être de nature continue ou discrète et peuvent représenter votre système plus ou moins fidèlement。另外,你们可以paralléliser模拟倒accélérer l '徒弟。在这里,你们可以看到-être en mesure de réutiliser les modèles MATLAB和Simulink存在于système关于强化学习和最小万博1manbetx修改。

在知道+

实例和应用程序référence

你在强化学习implémentant des contrôleurs pour des problèmes告诉我们l ' équilibrage d ' un pendule inversé,导航在problème Grid World和le maintien équilibre d ' un pendule inversé d ' un战车。你们可以接受systèmes pour la régulation adaptivesde la vitesse和为véhicules autonomes提供的特许经营权。强化学习可以让你们在être中使用机器人的应用程序来实现轨迹的平面化,因为我们要学习运动。

在知道+