强化学习- MATLAB和Simulink万博1manbetx - 万博1manbetx,s manbetx 845,万博尤文图斯

强化学习

深度强化学习是机器学习的一个分支'implémenter des contrôleurs et des systèmes décisionnels pour des systèmes complex comme les robots ou les véhicules autonomes。深度强化学习您可以浏览'implémenter des réseaux de neurones provant des comportements complex en basant leur tissage sur données générées dynamiquà partir de modèles de simulation。你们不可以在这里学习données d' apprentice tisage prédéfini, labélisé不可以，可以在modèle d' simulation représentatif d' envirment和你们的学习水平相等你们可以在contrôler学习。

用MATLAB^®,仿万博1manbetx真软件^®等强化学习工具箱™你们可以在déploiement d’un système décisionnel的设计工作流程中学习。你们可以:

你们可以在强化学习中学习systèmes contrôle simple, systèmes autonomes和robotique的例子
Évaluer等算法的普及，加强学习，通过快速的，à，其他的修改，à apporter au代码
Utiliser des réseaux de neurones pour définir des politiques de Reinforcement Learning complex basées sur des images, des vidéos et des données de capteurs
Accélérer l ' tissage des politiques en exécutant plusieurs emulation en parallèle en utilisant des cœurs en local ou dans le cloud
Déployer des contrôleurs de Reinforcement Learning sur des dispositifs embarqués

Les agents du Reinforcement Learning

强化学习的代理们在état en entrée和一次行动中了解一种政策，因为我们的算法对这项计划负责à jour de cette politique。深度q -网络、行动者-评论家和深度确定性政策梯度是流行算法的范例。算法遇见à jour la politique façon à最大化récompense关于长期环境的信号。

Les politiques peuvent être représentées par des réseaux de neurones profond, des polynômes和查找表。您可以使用implémenter代理prédéfinis您可以使用personnalisés对象MATLAB和Simulink。万博1manbetx

在知道+

Définir les agents du Reinforcement Learning in MATLAB——文档
Représenter des politiques在MATLAB中，réseaux des neurones prods——文档
Entraîner un agent DDPG pour le contrôle d 'un système de réservoir d 'eau dan万博1manbetxs Simulink- - - - - -为例
强化学习pour un penduldule inversé avec des images(5:04)——视频
Créer et entrainer des agents de Reinforcement Learning de manière interactive(38)——视频

Modéliser环境通过MATLAB和Simulink实现万博1manbetx

强化学习算法的学习是一个动态过程，在主体与环境交互的过程中。Pour des applications come la robotique et les systèmes autonomes, il peut s 'avérer coûteux et dangereux de réaliser cet entraînement dans des conditions réelles avec du véritable hardware。这是强化学习的基础，主要内容是préférable de générer des données通过des modèles virtuels représentatifs de l ' environment进行模拟。

你们可以在MATLAB和Simulink中下载créer un modèle de votre环境，在MATLAB和Simulink万博1manbetx中下载décrit la dynamique du système，行动的影响réalisées par l 'agent和une récompense qui évalue le bien-fondé de l 'action réalisée。Ces modèles peuvent être de nature continue ou discrète et peuvent représenter votre système plus ou moins fidèlement。另外，你们可以paralléliser模拟倒accélérer l '徒弟。在这里，你们可以看到-être en mesure de réutiliser les modèles MATLAB和Simulink存在于système关于强化学习和最小万博1manbetx修改。

在知道+

Créer des environments MATLAB pour le Reinforcement Learning——文档
Créer des environments Si万博1manbetxmulink pour le Reinforcement Learning——文档
Définir des signaux de récompense pour les systèmes连续和离散——文档
Entraîner un agent à l 'aide du calcul parallèle dans万博1manbetx Simulink- - - - - -为例

实例和应用程序référence

你在强化学习implémentant des contrôleurs pour des problèmes告诉我们l ' équilibrage d ' un pendule inversé，导航在problème Grid World和le maintien équilibre d ' un pendule inversé d ' un战车。你们可以接受systèmes pour la régulation adaptivesde la vitesse和为véhicules autonomes提供的特许经营权。强化学习可以让你们在être中使用机器人的应用程序来实现轨迹的平面化，因为我们要学习运动。

在知道+

Contrôle des process avec le Reinforcement Learning(15:34)——视频
Résoudre les problèmes Grid World avec le Q-Learning- - - - - -为例
Entraîner联合国代理DDPG pour la régulation adaptivede la vitesse- - - - - -为例
Entraîner un robot bipède à marcher avec un agent DDPG- - - - - -为例
MATLAB石油和天然气会议2019:强化学习的工作流程(21:38)——视频
强化学习在金融领域(15)——视频

再加上强化学习的信息

强化学习工具箱——表示
进口商:réseaux de neurones prods préentraînés——文档
Déployer des politiques entraînées sur des GPU——文档

entraîner votre机器人(avec le深度强化学习)(37:08)——视频
强化学习(5个视频)- Série de vidéos
强化学习pour un penduldule inversé avec des images(5:04)——视频
强化学习为永磁同步电机的指挥向量(12)——视频

强化学习与MATLAB和Simulink万博1manbetx

30天的免费版

在知道+

你们有问题吗?

Échangez avec是深度学习方面的专家。

Contactez-nous par邮件