强化学习工具箱™proporciona una app, funciones y un bloque de Simulink万博1manbetx®para entrenar políticas usando算法强化学习,故事como DQN, PPO, SAC和DDPG。Estas políticas se pueden emplear para执行控制和算法toma de decision para应用和完成,故事asignación de recursos, robótica y sistema autónomos。
Esta工具箱permite代表políticas y函数函数的价值usando redes神经元深度函数的tablas de búsqueda, y entrenarlas a través de相互作用的con entornos modelados en MATLAB®o模万博1manbetx型。Puede评估算法增强学习单代理或多代理比例在工具箱中,desarrollar los suyos丙。研究实验与配置hiperparámetros,管理研究进展与模拟研究互动方式través研究方法programática。Para mejorar el rendimiento del entrenamiento, es可能的射出模拟并行变型CPU, GPU,集群和nube (con并行计算工具箱™和MATLAB并行服务器™)。
El formato ONNX™permite importar políticas存在一个partr de marcos de深度学习como TensorFlow™Keras y PyTorch (con深度学习工具箱™)。Puede通用código C, c++ y CUDA®optimizado para desplegar las políticas entrenadas en microcontroladores y GPU。参考工具书,工具书,工具箱,ayudarán参考资料。
Mas给:
算法的修正
Deep Q-Network (DQN), Deep Deterministic Policy Gradient (DDPG), Proximal Policy Optimization (PPO) and otros algorithm itmos integrados。利用plantilla para desarrollar agents personizados para entrrenar políticas。
App强化学习设计师
Diseñe, entrene y simule interactivamente agents de reinforcement learning。输出代理entrenados的MATLAB para su后路输出。
Representación de funciones de valores y políticas con redes深奥神经元
空间综合系统estado-acción,定义políticas神经系统研究方法programática,计算程序深度学习工具箱,形式上的互动深度网络设计器.Si lo prefiere, puede utility la arquitectura red predeterminada sugerida por la toolbox。Inicialice la política实用的el aprendizaje por imitación para加速el entrenamiento。导入和导出模型的ONNX para许可la互操作性con otros marcos de深度学习。
强化学习单智能体和多智能体与Simulink万博1manbetx
Cree y entrene agents de reinforcement learning en S万博1manbetximulink con el bloque RL Agent。Entrene varios agents simultáneamente(强化学习多代理)en Simulink utilzando varias inst万博1manbetxancias del bloque RL代理。
Entornos de 万博1manbetxSimulink y Simscape
使用Simuli万博1manbetxnk y Simscape™para crear un modelo de un entorno。特别是señales de observación, acción y报酬在模型中。
Entornos de MATLAB
利用函数和类的MATLAB para modelar unentorno。具体的las变量de observación, acción y recompensa en el archivo de MATLAB。
Cálculo distribuido y aceleración multinúcleo
对射,对射,对射multinúcleo,对射,对射,对射,对射,对射,对射,对射cálculo usando并行计算工具箱yMATLAB并行服务器.
Generación de código
UtiliceGPU编码器™para generar código CUDA optimizado a partir de código de MATLAB que representation redes entrenadas。Genere código C/ c++ conMATLAB编码器™Para desplegar políticas。
Soporte de MATLAB编译器
UtiliceMATLAB编译器™yMATLAB编译SDK™para desplegar políticas entrenadas como aplicaciones independdientes, librerías C/ c++ compartidas, ensamblos Microsoft®.NET, Java类®y paquetes de Python®.
首先出来的
Descubra cómo desarrollar políticas de强化学习para problem tales como invertir un péndulo简单,导航un entrorno de网格世界,平衡un péndulo invertido, y resolver procesos de decisión genéricos de Markov。
Conduccion自治
Diseñe políticas关于强化学习的应用程序conducción autónoma,关于适应过程控制的故事,关于应用程序的辅助程序automático。
Robotica
Diseñe políticas de强化学习para aplicaciones de robótica。
调整,calibración y planificación
Diseñe políticas de强化学习para aplicaciones de ajuste, calibración y planificación。
产品递归:
意德vídeos清醒的强化学习
Aprenda más清醒强化学习con esta serie de vídeos。