从系列:应用机器学习
赛斯迪兰,MathWorks
介绍在嵌入式设备上运行机器学习模型的几个关键技术和最佳实践。
该视频讨论了提高模型速度和减少内存占用的选项,包括自动C/ c++代码生成、特性选择和模型缩减。
“机器学习”一词让人想起使用大量计算来训练模型的复杂算法。但是在“嵌入式设备”上的计算在可用的内存和计算量上是有限的。
现在,当我说“嵌入式设备”时,我指的是带有特殊用途计算系统的物体,所以想象一下家用电器或自动驾驶汽车上的传感器。
今天,我们将讨论为嵌入式设备准备机器学习模型时需要记住的不同因素。
为了进行预测,不同类型的模型需要不同的内存和时间。例如,单个决策树速度很快,只需要少量内存。最近邻方法速度较慢,需要更多内存,因此您可能不希望将它们用于嵌入式应用程序。
在决定在嵌入式设备上使用哪种模型时,另一件要记住的事情是如何将模型移植到设备上。
大多数嵌入式系统是用C等低级语言编写的。
但机器学习通常是在高级解释语言中完成的,如MATLAB、Python或R。
如果你必须在两种不同的语言中维护代码库,保持它们的同步将是非常痛苦的。
MATLAB提供了自动将机器学习模型转换为C代码的工具,因此您不需要单独在C中手动实现模型。
那么,如果在将一个模型转换为C语言之后,您发现它不能满足我们系统的需求,该怎么办呢?也许内存占用太大,或者模型花费太长时间来进行预测?
您可以尝试其他类型的模型,看看代码是否满足需求。也许可以从一个简单的模型开始,比如决策树。
或者,您可以回到流程的早期,看看是否可以减少模型中的特性数量。您可以使用邻域组件分析等工具,这对于确定特性对结果的影响非常有用。如果你看到某些功能权重较低,你可以将它们从我们的模型中删除,使我们的模型更简洁。
某些类型的模型具有与之相关的不同的简化技术。对于决策树,可以使用修剪技术,删除提供最小精度改进的节点。
另一种方法是考虑减少存储模型参数所需的内存。例如,看看模型是否可以转换为保持可接受精度的定点表示。
根据您的用例,这些策略中的任何一种都可能是合适的。硬件考虑、网络连接和预算都是影响设计决策的关键因素。
这只是对嵌入机器学习模型的一个快速概述。有关为嵌入式设备准备模型的更多信息,请参见下面的链接。
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。