如何训练你的机器人（深度强化学习）

卢卡斯·加西亚Mathworks

人工智能(AI)正在改变自动系统，从语音助手和聊天机器人，到自动驾驶汽车和机器人。人工智能系统具有学习和适应经验的能力，以提高其预测能力。

深度学习是机器学习的一个子集，其中人工神经网络(受人类大脑启发的算法)从大量数据中学习。深度学习颠覆了机器学习的世界，允许深度神经网络在图像分类、语音和手写识别以及自动驾驶等各种任务中达到接近或高于人类的准确性。

强化学习正在彻底改变深度学习的应用——从在视频游戏中玩和击败最优秀的人类玩家，到训练机器人完成复杂的技术任务。强化学习包括学习如何做（将情境映射到行动），以最大化数字奖励信号。它成功地训练了计算机程序，使其比世界上最好的人类玩家玩得更好（如围棋和星际争霸2）。这些程序可以在状态和行动空间大、世界信息不完善、短期行动长期效果不确定的游戏中找到最佳行动。工程师和科学家在设计控制器等实际系统时面临着同样的挑战。强化学习还能帮助解决复杂的控制问题，比如让机器人行走或驾驶自动驾驶汽车吗？

在这次演讲中,我们的目标是回答这个问题的解释什么是强化学习的背景下,传统的控制问题,显示如何生成仿真数据,建立和解决强化学习问题,并允许一个虚拟机器人学习复杂的任务,比如走路,使用深度强化学习。

录制于2019年Big Things Conference。