强化学习工具箱

更新

强化学习工具箱

強化学習を用いた方策の設計および学習

詳細を見る:

強化学習エージェント

MATLABや仿真万博1manbetx软件で方策を学習させるための強化学習エージェントの作成および構成を行います。組み込みの強化学習アルゴリズムを使用するか,カスタムの強化学習アルゴリズムを開発します。

強化学習アルゴリズム

深Q-Network (DQN),深層決定論的方策勾配法(DDPG),近傍方策最適化(PPO)などの組み込みアルゴリズムを使用して,エージェントを作成します。テンプレートを使用して,方策の学習のためのカスタムエージェントを開発します。

强化学习工具箱で使用できる学習アルゴリズム。

強化学習デザイナーアプリ

強化学習エージェントの設計,学習,シミュレーションを対話的に行います。後で使用したり展開できるように,学習済みのエージェントをMATLABにエクスポートします。

ディープニューラルネットワークによる方策と価値関数の表現

大きな状態行動空間を持つ複雑なシステムでは,ディープニューラルネットワークの方策をプログラムで定義します。この場合,深度学习工具箱の層を使用するか,ディープネットワークデザイナーを使用して対話的に定義します。または,このツールボックスで提案される既定のネットワークアーキテクチャを使用します。模倣学習を使用して方策を初期化し,学習を高速化します。他のディープラーニングフレームワークとの相互運用のためにONNXモデルのインポートおよびエクスポートを行います。

万博1manbetx仿真软件によるシングルエージェントおよびマルチエージェントの強化学習

万博1manbetx仿真软件でRL代理ブロックを使用して,強化学習エージェントの作成と学習を行います。万博1manbetx仿真软件でRL代理ブロックの複数のインスタンスを使用して,複数のエージェントの学習を同時に行います(マルチエージェントの強化学習)。

万博1manbetx模型用の強化学習エージェントブロック。

環境のモデル化

MATLABおよび仿真万博1manbetx软件の環境モデルを作成します。システムダイナミクスを記述し,エージェントの学習のための観測信号と報酬信号を指定します。

万博1manbetx仿真软件およびSimscape環境

万博1manbetx仿真软件およびSimscape™を使用して,環境のモデルを作成します。モデル内で観測信号,行動信号,報酬信号を指定します。

二足歩行ロボットのための仿万博1manbetx真软件環境モデル。

MATLAB環境

MATLABの関数やクラスを使用して,環境をモデル化します。MATLABファイル内で、観測変数、行動変数、報酬変数を指定します。

3自由度のロケット向けMATLAB環境。

学習の高速化

GPU,クラウド,分散コンピューティングリソースを使用して学習を高速化します。

分散コンピューティングおよびマルチコアによる高速化

学習を高速化するために,并行计算工具箱MATLAB并行服务器を使用して,マルチコアコンピューター,クラウドリソース,または計算クラスター上で並列シミュレーションを実行します。

並列計算を使用して,学習を高速化。

GPUによる高速化

高性能なNVIDIA®GPUを使用して,ディープニューラルネットワークの学習と推論を高速化します。并行计算工具箱と共に,以3.0计算能力上のほとんどのCUDA対応NVIDIA GPUでMATLABを使用できます。

GPUを使用した学習の高速化。

コードの生成と展開

学習済みの方策を,組み込みデバイスに展開したり,さまざまな実稼働システムに統合できます。

コード生成

学習済みの方策を表現するMATLABコードから最適化されたCUDAコードを生成するにはGPU编码器™を使用します。方策を展開するためのC / c++コードの生成にはMATLAB编码器™を使用します。

GPU编码器を使用したCUDAコードの生成。

MATLAB编译器のサポート

MATLAB编译器™MATLAB编译器SDK™を使用して,学習済みの方策をスタンドアロンのアプリケーション,C / c++共有ライブラリ,微软®netアセンブリ,Java®クラス,Python®パッケージとして展開します。

方策をスタンドアロンのプログラムとしてパッケージ化して共有。

参照例

ロボティクス,自動運転,キャリブレーション,スケジューリングなどの用途向けにコントローラーや意思決定アルゴリズムを設計します。

調整,キャリブレーション,およびスケジューリング

調整,キャリブレーション,およびスケジューリングの用途向けに強化学習方策を設計します。

配水のリソース割り当ての問題。

強化学習ビデオシリーズ

このビデオシリーズを見て,強化学習について学習しましょう。