加固学习工具箱

更新

加固学习工具箱

强化学习を用いた方策の设计および学习

详细を见る:

强化学习エージェント

MATLABやSi万博1manbetxmulink中で方策を学习させるための强化学习エージェントの作成および构成を行います。组み込みの强化学习アルゴリズムを使用するか,カスタムの强化学习アルゴリズムを开発します。

强化学习アルゴリズム

深Q-网络(DQN),深层决定论的方策勾配法(DDPG),近傍方策最适化(PPO)などの组み込みアルゴリズムを使用して,エージェントを作成します。テンプレートを使用して,方策の学习のためのカスタムエージェントを开発します。

强化学习工具箱で使用できる学习アルゴリズム。

强化学习デザイナーアプリ

强化学习エージェントの设计,学习,シミュレーションを対话的に行います。后で使用したり展开できるように,学习済みのエージェントをMATLABにエクスポートします。

ディープニューラルネットワークによる方策と価値关数の表现

大きな状态行动空间を持つ复雑なシステムでは,ディープニューラルネットワークの方策をプログラムで定义します。この场合,深度学习工具箱の层を使用するか,ディープネットワークデザイナーを使用して対话的に定义します。または,このツールボックスで提案される既定のネットワークアーキテクチャを使用します。模仿学习を使用して方策を初期化し,学习を高速化します。他のディープラーニングフレームワークとの相互运用のためにONNXモデルのインポートおよびエクスポートを行います。

万博1manbetxSimulink的によるシングルエージェントおよびマルチエージェントの强化学习

万博1manbetxSimulink中でRL代理ブロックを使用して,强化学习エージェントの作成と学习を行います.SimulinkでRL代理ブロックの复数のインスタンスを使用して,复数のエージェントの学习を同时に行います(マルチエージェントの强化学习)。

万博1manbetxSimulink的用の强化学习エージェントブロック。

环境のモデル化

MATLABおよびSi万博1manbetxmulink中の环境モデルを作成します。システムダイナミクスを记述し,エージェントの学习のための観测信号と报酬信号を指定します。

万博1manbetxSimulink的および的Simscape环境

万博1manbetxSimulink的および的Simscape™を使用して,环境のモデルを作成します。モデル内で観测信号,行动信号,报酬信号を指定します。

二足歩行ロボットのためのS万博1manbetximulink的环境モデル。

MATLAB环境

MATLABの关数やクラスを使用して,环境をモデル化します.MATLABファイル内で,観测変数,行动変数,报酬変数を指定します。

3自由度のロケット向けMATLAB环境。

学习の高速化

GPU,クラウド,分散コンピューティングリソースを使用して学习を高速化します。

分散コンピューティングおよびマルチコアによる高速化

学习を高速化するために,并行计算工具箱MATLAB并行服务器を使用して,マルチコアコンピューター,クラウドリソース,または计算クラスター上で并列シミュレーションを実行します。

并列计算を使用して,学习を高速化。

GPUによる高速化

高性能なNVIDIA®GPUを使用して,ディープニューラルネットワークの学习と推论を高速化します。并行计算工具箱と共に,计算能力3.0以上のほとんどのCUDA対応NVIDIA GPUでMATLABを使用できます。

GPUを使用した学习の高速化。

コードの生成と展开

学习済みの方策を,组み込みデバイスに展开したり,さまざまな実稼働システムに统合できます。

コード生成

学习済みの方策を表现するMATLABコードから最适化されたCUDAコードを生成するにはGPU编码器™を使用します。方策を展开するためのC / C ++コードの生成にはMatlab Coder™を使用します。

GPU编码器を使用したCUDAコードの生成。

MATLAB编译のサポート

Matlab Compiler™MATLAB编译器SDK™を使用して,学习済みの方策をスタンドアロンのアプリケーション,C / C ++共有ライブラリ,微软®.NETアセンブリ,爪哇®クラス,巨蟒®パッケージとして展开します。

方策をスタンドアロンのプログラムとしてパッケージ化して共有。

参照例

ロボティクス,自动运転,キャリブレーション,スケジューリングなどの用途向けにコントローラーや意思决定アルゴリズムを设计します。

调整,キャリブレーション,およびスケジューリング

调整,キャリブレーション,およびスケジューリングの用途向けに强化学习方策を设计します。

配水のリソース割り当ての问题。

强化学习ビデオシリーズ

このビデオシリーズを见て,强化学习について学习しましょう。