强化学习工具箱

강화학습을사용하여정책을설계하고훈련할수있습니다。

무료평가판다운로드

가격보기

加固学习工具箱™는dqn，ppo，sac및ddpg와같은강화학습을사용하는정책을을훈련위한위한，simulink万博1manbetx^®블록을제공합니다。이러한정책을사용하여하여，로봇로봇，자율자율과같은응용사례의의제어기및사결정알고리즘을구현할수수있습니다있습니다있습니다。

이툴박스를사용하면하면신경망또는에이블사용하여하여정책가치함수함수를표현할할수있고있고있고^®또는仿万博1manbetx真软件에서모델링된환경과의상호작용을통해이런정책과가치함수를훈련시킬수있습니다。툴박스에서제공하는단일에이전트또는다중에이전트강화학습알고리즘을평가하거나직접개발할수있습니다。앱을통한대화형방식또는프로그래밍방식으로하이퍼파라미터설정을실험하고훈련진행상황을모니터링하고훈련된에이전트를시뮬레이션할수있습니다。훈련성능을향상하기위해시뮬레이션을다중CPU、GPU,컴퓨터클러스터및클라우드에서병렬로실행할수있습니다。(并行计算工具箱™및MATLAB并行服务器™사용)

Onnx™모델형식을을tensorflow™keras및pytorch등의딥러닝딥러닝프레임워크기존을가져올수수수（深度学习工具箱™사용）최적화된C，C ++，CUDA^®코드를생성훈련된을마마마및및및gpu에배포할수있습니다。툴박스에는시작을돕기위한참조예제가포함되어있습니다。

시작하기:

钢筋学习工具箱란？

강화학습에이전트

강화학습에이전트를생성하고구성하여matlab및simulin万博1manbetxk에서정책을할수있습니다。내장된강화학습알고리즘을사용사하거나사지정강화학습을을개발할있습니다。

강화학습알고리즘

DQN（深Q-Network），DDPG（深度确定性政策梯度），PPO（近端策略优化）및및내장알고리즘사용하여에이전트를를만들수수템플릿을사용하여정책을훈련사용자에이전트를를개발할수수

강화학습에이전트훈련시키기

내장에이전트

사용자지정에이전트만들기

이족보행로봇에게보행훈련시키기

钢筋学习工具箱에서사용가능한한훈련。

加固学习设计师앱

대화형방식으로강화학습에이전트를설계,훈련,시뮬레이션할수있습니다。향후사용및배포를위해훈련된에이전트를MATLAB으로내보낼수있습니다。

加固学习设计师

强化学习设计师앱을사용하여에이전트를설계하고훈련시키기

대화형방식으로강화학습에이전트생성생성및훈련

심층신경망을사용한정책및가치함수표현

대규모상태——행동공간을사용하는복잡한시스템의경우深度学习工具箱의계층을사용하거나대화형방식의심층신경망디자이너를통해심층심층신경망정책정책프로그래밍방식으로정의정의할수수또는툴박스에서제안하는기본아키텍처아키텍처사용할수도있습니다。모방학습으로정책을초기화하여을가속화할수있습니다。다른다른딥러닝프레임워크와와의상호을을위해위해위해을을을을오고오고오고내보낼수수

심층신경망표현만들기및가져오기

심층신경망디자이너를사용하여에이전트만들기

모방학습으로DDPG演员网络초기화초기화

강화학습에이전트초기화옵션