机器学习是一种数据分析技术,教计算机做什么顺其自然人类和动物:从经验中学习。机器学习算法使用的计算方法直接从数据“学习”的信息,而不依赖于预定方程模型。该算法自适应地提高他们的可用于学习的增加样本数量的性能。深度学习是机器学习的一种特殊形式。
机器学习算法找出产生的洞察力,帮助你做出更好的决策和预测数据的自然形态。他们每天都在使用,使医疗诊断,股票交易,能源负荷预测,更关键的决策。例如,媒体网站依靠机器学习数以百万计的选项进行筛选,以给你歌曲或电影的建议。零售商用它来深入了解客户的购买行为。
考虑使用机器学习,当你有一个复杂的任务,或涉及大量的数据和大量的变量的问题,但没有现成的公式或公式。例如,机器学习是一个不错的选择,如果你需要这样的处理情况:
手写规则和公式过于复杂,在面部识别和语音识别。
任务的规则不断变化,如从交易记录的欺诈检测。
数据的性质不断变化,程序需要适应,因为在自动交易,能源需求预测,并预测购物趋势。
机器学习使用两种类型的技术:监督学习,这列车上已知的输入和输出数据的模型,因此它可以预测未来的输出,以及无监督学习,其发现隐藏的模式或在输入数据的固有结构。
监督机器学习建立一个模型基础上的不确定性的存在证据,使预测。受监督的学习算法将一组已知的输入数据和已知响应的数据(输出)和火车的模型来产生用于响应于新的数据合理预测。使用监督学习,如果你已经知道数据对您正在试图预测输出。
监督学习使用分类和回归技术开发预测模型。
分类技术预测离散的反应,例如,电子邮件是否正规垃圾邮件,或者是否肿瘤是癌或良性。分类型输入数据分为两类。典型的应用包括医疗成像,语音识别和信用评分。
用途分类,如果你的数据可以被标记,分类或分解为特定的群体或阶层。例如,对于手写识别用途分类应用程序能识别字母和数字。在图像处理和计算机视觉,无监督模式识别技术用于物体检测和图像分割。
进行分类的统一算法包括万博1manbetx支持向量机(SVM),提振和袋装决策树,ķ-最近的邻居,朴素贝叶斯,判别分析,回归和神经网络。
回归技术预测连续反应,例如,改变在电力需求温度或波动。典型的应用包括电力系统负荷预测算法交易。
使用回归技术,如果您正在使用的数据范围的工作,或者如果你的反应的本质是实数,如温度或时间,直到故障的一台设备。
假设医生要预测一个人是否有在一年内心脏发作。他们对以前的患者,包括年龄,体重,身高,血压数据。他们知道以前的患者是否有在一年内心脏发作。所以,问题是现有的数据组合成可以预测一个新的人是否有在一年内心脏发作的模型。
选择正确的算法似乎可以压倒,有几十个监督和无监督的机器学习算法,每个采用不同的方法来学习。
没有最好的方法或一刀切。找到合适的算法部分是正义的审判和错误,甚至是经验丰富的数据科学家也说不清的算法是否会没有想出来工作。但算法选择也取决于你用,你想从数据获得洞察力的工作数据的大小和类型,以及这些见解将如何使用。
这里有监督和无监督的机器学习之间进行选择的一些准则:
在艺术与人工智能实验室在罗格斯大学的研究人员想看看是否一个计算机算法可以按风格,流派和艺术家一样容易作为一个人归类画。他们开始通过识别分类的绘画风格的视觉特征。该算法开发它们分类的风格绘画与60%的准确度数据库,跑赢典型的非人类专家。
研究人员推测的风格分类(监督学习问题)有用的视觉特征也可以被用来确定艺术的影响(无人监督的问题)。
他们使用的分类算法训练在谷歌图像识别特定对象。他们测试了从66名不同的艺术家合作过550年的时间里超过1700所绘画的算法。该算法很容易识别连接的作品,其中包括维拉斯奎兹对弗朗西斯·培根的“研究之后委拉斯开兹的肖像教皇英诺森十的”,“肖像教皇英诺森十”的影响
在办公楼,医院等大型商业建筑的采暖,通风和空调(HVAC)系统往往是低效的,因为他们没有考虑到天气变化,可变能源成本,或建筑物的热性能。
BuildingIQ的基于云计算的软件平台解决了这个问题。该平台采用先进的算法和机器学习方法,从功率计,温度计,和暖通空调压力传感器,以及天气和能源成本信息不断的过程字节。特别地,机器学习用于分段数据和确定气体,电,蒸汽,和太阳能发电的加热和冷却过程中的相对贡献。该BuildingIQ平台正常运行期间减少空调能耗的大型商业建筑的10-25%。
拥有超过800万个会员中,RAC是英国最大的汽车组织之一,向私人和商业汽车驾驶员提供道路救援,保险等业务。
为了让到路边事件的快速响应,减少事故,并降低保险费用,该RAC开发的车载碰撞传感系统,它使用先进的机器学习算法来检测低速碰撞和区分比较常见的驾驶事件,如驾驶过这些事件减速带或坑洼。独立的试验表明在RAC系统在检测测试崩溃92%准确。