2:37视频长度为2:37。
机器学习介绍,第1部分:机器学习基础
从系列中:机器学习概论
探索机器学习背后的基本原理。了解两种常见的机器学习方法:
- 无监督学习,在输入数据中发现隐藏的模式
- 监督学习,在已知的输入和输出数据上训练模型,以便预测未来的输出
您还将了解这些方法中的三个常见技术:
- 聚类技术根据数据中的共享特征将数据分为不同的组。
- 分类技术预测离散的响应——比如一封邮件是真实的还是垃圾邮件。
- 回归技术预测连续响应,比如恒温器应该设置在什么温度或电力需求的波动。
今天,我们将讨论机器学习。我们将重点介绍它是什么以及为什么要使用它。
机器学习教会计算机做人类与生俱来的事情:从经验中学习。
它非常适合于涉及大量数据和大量变量的复杂问题,但没有现有的公式或方程来描述系统。
应用机器学习的一些常见场景包括:
- 当一个系统对手写规则来说太复杂时,比如人脸识别和语音识别。
- 当任务的规则不断变化时,例如在欺诈检测中。
- 当数据本身的性质不断变化时,比如自动交易、能源需求预测和预测购物趋势。
机器学习使用两种类型的技术:
- 无监督学习可以在输入数据中发现隐藏的模式,
- 还有监督学习,在已知的输入和输出数据上训练模型,以便预测未来的输出。
无监督学习从没有与输入数据相关联的标记响应的数据集中得出推论。
聚类是最常见的无监督学习技术。它根据数据中的共享特征将数据分为不同的组。
聚类用于在基因序列分析、市场研究和物体识别等应用中发现隐藏的分组。
另一方面,监督学习要求每个输入数据的示例都带有正确标记的输出。它使用这些标记数据,以及分类和回归技术,来开发预测模型。
分类技术预测离散的响应——比如一封邮件是真实的还是垃圾邮件。本质上,这些模型将输入数据分类为预先确定的类别集。
回归技术预测持续的响应,比如恒温器应该设置在什么温度,或者电力需求的波动。
同样,监督学习和无监督学习之间的最大区别在于,监督学习需要正确标记的示例来训练机器学习模型,然后使用该模型来标记新数据。
请记住:您使用的技术和选择的算法取决于您正在处理的数据的大小和类型,您希望从数据中获得的见解,以及如何使用这些见解。在接下来的几个视频中,我们将更多地讨论这些技巧。
到目前为止,这是一个非常简短的机器学习概述。请务必查看描述以获取更多信息。
您也可以从以下列表中选择一个网站:
如何获得最佳的网站性能
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。