介绍机器学习,第3部分:监督机器学习

亚当•Filion MathWorks

学习如何使用监督机器学习训练和预测模型的输入映射到输出为新的输入输出。

监督学习技术采取分类或者回归的形式。分类技术预测离散响应,而回归技术预测连续反应。这个视频走过不同的分类和回归算法。它还介绍一个示例,演示了如何监督机器学习在现实世界中工作。

监督学习算法需要在对应一组已知的输入数据和输出数据。然后火车模型的输入映射到输出,所以它可以预测响应任何新的输入数据。

正如我们前面所讨论的那样,所有监督学习技术的形式分类或回归。

分类技术预测离散响应。使用这些技术如果你想预测的输出可以分为不同的组。

分类问题的例子包括医学影像、语音识别、信用评分。

回归技术,另一方面,预测连续反应。

这是任何应用程序的一个很好的例子,你预测的输出可以取任意值在一定范围内,股票价格和声学信号处理。

现在,说你有一个你想解决分类问题。让我们来看一个简短的几个分类算法可以使用。

逻辑回归算法是最简单的。它是用于二元分类问题,意义问题,只有两个可能的输出。最好是当数据可以通过一个布置得井然有序,线性边界。您还可以使用它作为比较的基线对更复杂的分类方法。

袋装,促进了决策树结合个人决策树,更少的预测能力,成一个许多树,更大的预测能力。

时最好使用预测离散或非线性行为,当你有更多的时间来训练模型。

请记住还有很多其他分类算法;这些仅仅是两个最常见的。

有很多算法可供选择,如果你有一个回归的问题。

线性回归是一个统计建模技术。用它当你需要一个算法易于理解和快速适应,或者作为基线评估,更加复杂,回归模型。

非线性回归帮助描述更复杂的关系数据。用它当数据具有较强的非线性趋势和无法轻易转化为一个线性空间。

再一次,这些仅仅是两个常见的回归算法可以选择;有很多你可能想考虑。

现在,让我们把这一切放在一起,看看这个过程看起来在现实世界中。

说你是一个工程师在塑料生产设备。工厂的900名工人操作一天24小时,一年365天。

确保你发现机器故障发生之前,需要开发一个健康监测和预测维护应用程序,使用先进的机器学习算法对潜在问题进行分类。

在收集、清洗和日志数据从工厂的机器,你的团队评估几个分类技术。对于每一个技术,团队训练分类模型使用机器的数据,然后测试模型的预测能力如果一台机器有问题。

袋装的测试表明,一个决策树是最准确的。所以,这就是你的团队向前发展预见性维护应用程序时。

除了尝试不同类型的模型,有很多方法可以进一步提高模型的预测能力。让我们简要地讨论这些方法的三…

第一个是特征选择,你确定最相关的输入数据,提供最好的预测能力。记住:一个模型只能一样好您所使用的特征来训练它。

第二,功能转换是一种降维,我们讨论了在前面的视频。这里有三个最常用的技术。

与功能转换,你降低你的数据的复杂性,这可以让你更容易表示和分析。

Hyperparameter调优是第三种方法来增加你的模型的准确性。这是一个迭代的过程,你的目标是找到最好的设置如何训练模型。你再培训模型多次使用不同的设置,直到你发现的组合设置结果最精确的模型。

这是一个快速查看监督学习。在我们下一节,我们将看一个更深的机器学习一个例子工作流。

在那之前,一定要看看下面的描述更多有用的机器学习资源和链接。谢谢收看。