什么是机器学习?

三件事情你需要知道的

机器学习是一种数据分析技术,教计算机做什么顺其自然人类和动物:从经验中学习。机器学习算法使用的计算方法直接从数据“学习”的信息,而不依赖于预定方程模型。该算法自适应地提高他们的可用于学习的增加样本数量的性能。深度学习是机器学习的一种特殊形式。

为什么机器学习事项

随着上升大数据,机器学习已成为解决地区问题,如关键技术:

通过三种机器学习(聚类,分类和回归)在本概述由罗兰舒尔的步行路程。

更多的数据,更多的问题,更好的答案

机器学习算法在数据中发现自然模式,从而产生洞察力,帮助你做出更好的决策和预测。它们每天都被用于医疗诊断、股票交易、能源负荷预测等方面的关键决策。例如,媒体网站依靠机器学习从数百万个选项中筛选出歌曲或电影推荐。零售商利用它来洞察顾客的购买行为。

当你应该使用机器学习?

当你有一个复杂的任务或问题,涉及大量的数据和变量,但没有现成的公式或方程时,考虑使用机器学习。例如,如果你需要处理以下情况,机器学习是一个不错的选择:

手写规则和公式过于复杂,在面部识别和语音识别。

任务的规则是不断变化的——比如从交易记录中发现欺诈。

数据的性质一直在变化,程序需要适应变化,比如自动交易、能源需求预测和预测购物趋势。

如何机器学习工程

机器学习使用两种类型的技术:监督式学习,它根据已知的输入和输出数据训练模型,以便预测未来的输出无监督学习,其发现隐藏的模式或在输入数据的固有结构。

图1.机器学习技术包括无监督和监督学习。

获取这本电子书,通过动手机器学习教程,帮助您掌握机器学习技术下载代码,并一步。

监督式学习

监督机器学习在存在不确定性的情况下,建立一个基于证据的预测模型。监督学习算法采用一组已知的输入数据和对数据的已知响应(输出),并训练一个模型来生成对新数据响应的合理预测。如果你已经知道你要预测的输出数据,那么就使用监督学习。

监督学习使用分类和回归技术开发预测模型。

分类技术预测离散的反应,例如,电子邮件是否正规垃圾邮件,或者是否肿瘤是癌或良性。分类型输入数据分为两类。典型的应用包括医疗成像,语音识别和信用评分。

用途分类,如果你的数据可以被标记,分类或分解为特定的群体或阶层。例如,对于手写识别用途分类应用程序能识别字母和数字。在图像处理和计算机视觉,无监督模式识别技术用于物体检测和图像分割。

执行分类的常用算法包括万博1manbetx支持向量机(SVM)提振袋装决策树ķ最近的邻居朴素贝叶斯判别分析逻辑回归神经网络

回归技术预测连续的响应——例如,温度的变化或电力需求的波动。典型的应用包括电力负荷预测和算法交易。

使用回归技术,如果您正在使用的数据范围的工作,或者如果你的反应的本质是实数,如温度或时间,直到故障的一台设备。

常用的回归算法包括线性模型非线性模型正规化逐步回归提振袋装决策树神经网络自适应神经模糊学习

使用监督学习预测心脏病发作

假设医生要预测一个人是否有在一年内心脏发作。他们对以前的患者,包括年龄,体重,身高,血压数据。他们知道以前的患者是否有在一年内心脏发作。所以,问题是现有的数据组合成可以预测一个新的人是否有在一年内心脏发作的模型。

无监督学习

无监督学习发现隐藏的模式或在数据固有结构。它是用来从由输入数据,而不标记响应数据集得出推论。

聚类是最常见的无监督学习技术。它用于探索性数据分析,以发现数据中隐藏的模式或分组。申请聚类分析包括基因序列分析,市场调研,和物体识别。

例如,如果一家手机公司想要优化他们建造手机信号塔的位置,他们可以使用机器学习来估计依赖信号塔的人群的数量。手机一次只能与一个信号塔通话,因此该团队使用聚类算法来设计信号塔的最佳位置,以优化客户群体或集群的信号接收。

执行集群的常用算法包括k - means, k-medoids分层聚类高斯混合模型隐马尔可夫模型自组织映射,模糊c均值聚类减法聚类

图2.集群发现您的数据隐藏的模式。

你如何决定哪台机器学习算法使用?

选择正确的算法似乎可以压倒,有几十个监督和无监督的机器学习算法,每个采用不同的方法来学习。

没有最好的方法或一刀切。找到合适的算法部分是正义的审判和错误,甚至是经验丰富的数据科学家也说不清的算法是否会没有想出来工作。但算法选择也取决于你用,你想从数据获得洞察力的工作数据的大小和类型,以及这些见解将如何使用。

图3。机器学习技术。

这里有监督和无监督的机器学习之间进行选择的一些准则:

  • 选择监督式学习如果你需要训练的模型进行预测 - 例如,一个连续变量的未来值,如温度或股票价格,或分类,例如,从识别摄像头录像的汽车品牌。
  • 选择无监督学习如果您需要研究您的数据,并且想要训练一个模型来找到一个好的内部表示,例如将数据分割成集群。

机器学习与MATLAB

你怎么能利用机器学习的力量,用数据来做出更好的决策?MATLAB使得机器学习容易。随着用于处理大数据,以及应用,以提高机器学习访问工具和功能,MATLAB是将机器学习到您的数据分析的理想环境。

随着MATLAB,工程师和科学家的数据有直接访问预构建的功能,丰富的工具箱,并专门针对应用程序分类回归集群

MATLAB,您可以:

  • 比较方法,如回归,分类树,支持向量机,集成方法和万博1manbetx深度学习
  • 应用AutoML和其他模型细化和还原技术来创建优化模型
  • 集成机器学习模型为企业系统,集群和云,和目标模型实时嵌入式硬件。
  • 嵌入式传感器分析执行自动代码生成。
  • 万博1manbetx支持从数据分析集成的工作流来部署。

有趣的机器学习应用

创建能够分析艺术作品的算法

在艺术与人工智能实验室在罗格斯大学的研究人员想看看是否一个计算机算法可以按风格,流派和艺术家一样容易作为一个人归类画。他们开始通过识别分类的绘画风格的视觉特征。该算法开发它们分类的风格绘画与60%的准确度数据库,跑赢典型的非人类专家。

研究人员推测的风格分类(监督学习问题)有用的视觉特征也可以被用来确定艺术的影响(无人监督的问题)。

他们使用的分类算法训练在谷歌图像识别特定对象。他们测试了从66名不同的艺术家合作过550年的时间里超过1700所绘画的算法。该算法很容易识别连接的作品,其中包括维拉斯奎兹对弗朗西斯·培根的“研究之后委拉斯开兹的肖像教皇英诺森十的”,“肖像教皇英诺森十”的影响

HVAC优化能源使用的大型建筑

办公大楼、医院和其他大型商业建筑的采暖、通风和空调(HVAC)系统往往效率低下,因为它们没有考虑到不断变化的天气模式、可变的能源成本或建筑物的热特性。

BuildingIQ的基于云计算的软件平台解决了这个问题。该平台采用先进的算法和机器学习方法,从功率计,温度计,和暖通空调压力传感器,以及天气和能源成本信息不断的过程字节。特别地,机器学习用于分段数据和确定气体,电,蒸汽,和太阳能发电的加热和冷却过程中的相对贡献。该BuildingIQ平台正常运行期间减少空调能耗的大型商业建筑的10-25%。

检测低速车祸

拥有超过800万个会员中,RAC是英国最大的汽车组织之一,向私人和商业汽车驾驶员提供道路救援,保险等业务。

为了能够对路边事故做出快速反应,减少碰撞,降低保险成本,RAC开发了一个车载碰撞感知系统,该系统使用先进的机器学习算法来检测低速碰撞,并将这些事件与更常见的驾驶事件区分开,比如在减速带或坑洞上驾驶。独立测试表明,RAC系统在检测碰撞时的准确率为92%。

了解更多关于机器学习

在本网络研讨会中,您将学习如何开始使用机器学习工具来检测模式,并从您的数据集建立预测模型。在本节课中,您将学习MATLAB中几种可用的机器学习技术以及如何使用这些技术
了解如何申请,评估,微调和部署机器学习技术与MATLAB。
开始使用机器学习。从基本理念,以先进的算法学习的机器学习。下载电子书,以了解更多。
分类学习应用程序可以让你训练模型使用监督的机器学习分类数据。
了解如何使用选择模型,应用正则化技术,并在MATLAB进行交叉验证。