文档帮助中心

强化学习工具箱

使用强化学习设计和培训策略

强化学习工具箱™ 为使用强化学习算法（包括DQN、A2C和DDPG）的培训策略提供函数和块。您可以使用这些策略为复杂系统（如机器人和自治系统）实施控制器和决策算法。您可以使用深度神经网络、多项式或查找ta来实施策略布尔斯。

工具箱允许您通过使策略能够与MATLAB表示的环境交互来训练策略^®或Si万博1manbetxmulink^®模型。您可以评估算法，试验超参数设置，并监控培训进度。为了提高培训性能，您可以在云、计算机集群和GPU（使用并行计算工具箱）上并行运行模拟™ 和MATLAB并行服务器™).

通过ONNX™ 模型格式，可以从TensorFlow等深度学习框架导入现有策略™ Keras和PyTorch（带深度学习工具箱）™). 您可以生成优化的C、C++和CUDA代码，以在微控制器和GPU上部署经过训练的策略。

工具箱包括使用强化学习为机器人和自动驾驶应用程序设计控制器的参考示例。

开始

学习强化学习工具箱的基础知识

MATLAB环境

基于MATLAB的强化学习环境动力学模型

万博1manbetxSimulink环境

基于Simulink模型的强化学习环境动力学万博1manbetx

政策和价值功能

定义策略和值函数表示，如深度神经网络和Q表

代理人

使用常用算法（如SARSA、DQN、DDPG和A2C）创建和配置强化学习代理

培训和验证

训练和模拟强化学习代理

策略部署

代码生成和部署经过培训的策略

强化学习工具箱文档

万博1manbetx

试试MATLAB、Sim万博1manbetxulink和其他产品s manbetx 845