预测分析

预测分析

你需要知道的3件事

预测分析使用历史数据来预测未来事件。通常,历史数据被用来建立一个数学模型来捕捉重要的趋势。然后,该预测模型将用于当前数据,以预测接下来将发生什么,或建议采取行动,以获得最佳结果。

近年来,由于支持技术的进步,尤其是在大数据和机器学习领域,预测分析受到了很多关注。万博1manbetx

为什么预测分析很重要

大数据的兴起

预测分析通常是在大数据例如,工程数据来自世界各地的传感器、仪器和连接系统。公司的业务系统数据可能包括交易数据、销售结果、客户投诉和营销信息。越来越多的企业基于这些宝贵的信息做出数据驱动的决策。

竞争加剧

随着竞争的加剧,企业在将产品和服务带入拥挤的市场方面寻求优势。数据驱动的预测模型可以帮助公司以新的方式解决长期存在的问题。s manbetx 845

例如,设备制造商很难单独在硬件方面进行创新。产品开发商可以向现有解决方案添加预测功能,以增加客户价值。使用预测分析进行设备维护,或万博 尤文图斯预测性维护,可以预测设备故障,预测能源需求,并降低运营成本。例如,测量汽车部件振动的传感器可以在车辆在道路上发生故障之前发出需要维修的信号。

公司还使用预测分析来创建更准确的预测,例如预测电网的电力需求。这些预测可以更有效地进行资源规划(例如,各种发电厂的调度)。

面向大数据和机器学习的尖端技术

提取价值大数据,企业使用诸如Hadoop和Spark。数据源可能包括事务数据库、设备日志文件、图像、视频、音频、传感器或其他类型的数据。创新通常来自组合多个源的数据。

有了这些数据,就有必要使用工具来获取见解和趋势。机器学习技术用于发现数据中的模式,并建立预测未来结果的模型。有多种机器学习算法,包括线性和非线性回归、神经网络、支持向量机、决策树和其他算法。万博1manbetx

预测分析的例子

预测分析帮助金融、医疗保健、制药、汽车、航空航天和制造业等行业的团队。

  • 汽车-自动驾驶汽车的创新
    开发驾驶辅助技术和新型自动驾驶汽车的公司使用预测分析技术来分析来自联网车辆的传感器数据,并构建驾驶辅助算法。
  • 航空航天–监测飞机发动机健康状况
    为了提高飞机的启动时间并降低维护成本,一家发动机制造商创建了一个实时分析应用程序,用于预测油、燃料、升空、机械健康和控制的子系统性能。
  • 能源生产-预测电价和用电需求
    复杂的预测应用程序使用的模型可以监测植物的可用性、历史趋势、季节性和天气。
  • 金融服务——建立信用风险模型
    金融机构使用机器学习技术和定量工具来预测信贷风险。
  • 工业自动化与机械–预测机器故障
    一家塑料和薄膜生产商使用健康监测和预测性维护应用程序每月可节省50000欧元,从而减少停机时间并最大限度地减少浪费。
  • 医疗器械–使用模式检测算法识别哮喘和COPD
    哮喘管理设备记录和分析患者的呼吸声音,并通过智能手机应用程序提供即时反馈,帮助患者管理哮喘和COPD。

预测分析是如何工作的

预测分析是使用数据分析根据数据进行预测的过程。此过程使用数据以及分析、统计和分析机器学习创建预测未来事件的预测模型的技术。

术语“预测分析”描述了统计或机器学习技术的应用,以创建对未来的定量预测。通常情况下,监督机器学习技术用于预测未来的价值(这台机器在需要维护之前可以运行多久?)或者估计一个概率(这个客户拖欠贷款的可能性有多大?).

预测分析从一个业务目标开始:使用数据来减少浪费、节省时间或降低成本。该过程将异构的、通常是海量的数据集利用到模型中,以产生清晰的、可操作的结果来支持实现该目标,如减少材料浪费、减少库存以及生产出符合特定要求的产品影响。万博1manbetx

预测分析工作流程

我们都熟悉天气预报的预测模型。预测模型的一个重要工业应用与能源有关负荷预测预测能源需求。在这种情况下,能源生产商、电网运营商和贸易商需要准确预测能源负荷,以做出管理电网负荷的决策。大量数据可用,电网运营商可以使用预测分析将这些信息转化为可操作的见解。

预测分析工作流。

用于预测能源负荷的分步工作流程

通常,预测分析应用程序的工作流遵循以下基本步骤:

  1. 从各种来源导入数据,如web存档、数据库和电子表格。
    数据源包括CSV文件中的能源负荷数据和显示温度和露点的国家天气数据。
  2. 通过删除异常值并合并数据源来清理数据。
    确定要从数据中删除的数据峰值、缺失数据或异常点。然后将不同的数据源聚合在一起——在本例中,创建一个包含能量负载、温度和露点的表。
  3. 使用统计学、曲线拟合工具或机器学习,基于聚合数据开发准确的预测模型。
    能量预测是一个复杂的过程,有很多变量,所以你可以选择使用神经网络来建立和训练预测模型。迭代您的训练数据集以尝试不同的方法。当训练完成后,您可以针对新数据尝试模型,以查看它的性能如何。
  4. 将模型集成到生产环境中的负荷预测系统中。
    一旦找到准确预测负载的模型,就可以将其移动到生产系统中,使分析可用于软件程序或设备,包括web应用程序、服务器或移动设备。

纽约州能源负荷预测的预测分析应用。

发展预测模型

汇总的数据说明了一个复杂的问题。为了提取它所包含的洞察力,你需要一个精确的预测模型。

预测建模使用数学和计算方法来预测事件或结果。这些模型根据模型输入的变化预测未来某个状态或时间的结果。使用迭代过程,您可以使用训练数据集开发模型,然后测试和验证它,以确定其进行预测的准确性。你可以尝试不同的机器学习方法来找到最有效的模型。

例子包括时间序列回归预测模型航空运输量预测燃油效率基于线性回归模型发动机转速与负载的关系,以及发动机的剩余使用寿命估算模型预测.

预测分析vs.规定分析

已经成功实现预测分析的组织将说明性分析视为下一个前沿。预测分析对接下来会发生什么做出估计;说明性的分析告诉您如何根据预测以最佳方式做出反应。

规定性分析是数据分析的一个分支,它使用预测模型来建议为获得最佳结果而采取的行动。说明性分析依赖于优化和基于规则的技术来进行决策。预测负载在接下来的24小时内电网的一个例子就是预测分析,鉴于如何经营发电厂基于这一预测代表规范的分析.

有趣的预测分析MATLAB例子

公司正在寻找创新的方法来应用预测分析MATLAB®创造新的产品和服务,以新的方s manbetx 845式解决长期存在的问题。

这些示例说明了预测分析的实际应用:

贝克休斯利用数据分析和机器学习为天然气和石油开采设备开发预测性维护软件

贝克休斯卡车配备了正排量泵,将水和沙子的混合物注入深井。在150万美元的卡车总成本中,水泵约占10万美元,贝克休斯需要确定水泵何时会出现故障。他们以每秒50000个样本的速度处理和分析了10辆卡车上安装的传感器采集的高达1 TB的数据,并训练了一个神经网络,以使用传感器数据预测泵故障。该软件预计将减少30-40%的维护成本,或超过1000万美元。

BuildingIQ开发了大型建筑暖通空调能源优化的主动算法

大型商业建筑中的供暖、通风和空调(HVAC)系统往往效率低下,因为它们没有考虑到不断变化的天气模式、可变的能源成本或建筑的热性能。构建IQ基于云的软件平台使用先进的算法来连续处理来自电能表、温度计和暖通空调压力传感器的千兆字节的信息。机器学习用于分割数据,并确定燃气、电力、蒸汽和太阳能对加热和冷却过程的相对贡献。优化用于确定一天中每个建筑的最佳供暖和制冷时间表。建筑IQ平台使大型商业建筑正常运行时的暖通能耗降低10-25%。

开发检测算法以减少重症监护病房中的误报警

在重症监护病房(ICU)中,心电图机和其他患者监护设备的误报警是一个严重问题。来自假警报的噪音扰乱了患者的睡眠,频繁的假警报使临床工作人员对真正的警告失去了敏感性。心脏病生理网络/计算挑战赛的竞争对手被要求开发算法,以区分ICU监测设备记录的信号中的真警报和假警报。捷克科学院的研究人员凭借能够检测QRS波群、区分正常心跳和心室心跳以及过滤由心脏起搏器刺激引起的虚假QRS波群的MATLAB算法,在实时挑战类别中获得第一名。这些算法产生的真阳性率(TPR)和真阴性率(TNR)分别为92%和88%。

MATLAB预测分析

为了挖掘业务和工程数据的价值,做出明智的决策,开发预测分析应用程序的团队越来越多地转向MATLAB。

使用MATLAB工具和功能,您可以使用工程、科学和现场数据以及业务和事务数据执行预测分析。使用MATLAB,您可以将预测应用程序部署到大规模生产系统和嵌入式系统。

MATLAB用于预测分析。

为什么使用MATLAB进行预测分析?

  1. MATLAB分析可以处理业务和工程数据。
    MATLAB支持传感器、图像、视频、万博1manbetx遥测、二进制和其他实时格式。使用MATLAB用于Hadoop和Spark的Tall数组,并通过连接到ODBC/JDBC数据库的接口来探索这些数据。
  2. MATLAB让工程师自己做数据科学。
    让您的领域专家做数据科学,使用强大的工具,帮助他们做机器学习,深度学习,统计,优化,信号分析和图像处理。
  3. MATLAB分析在嵌入式系统中运行。
    通过在Matlab代码中创建可移植的C和C++代码,开发分析程序,运行在嵌入式平台上。
  4. MATLAB分析部署到企业IT系统。
    MATLAB集成到企业系统、集群和云中,并提供免版税的可部署运行时。

你的数据+ MATLAB =成功与预测分析

在这个简化的视图中,工程数据来自于世界各地的传感器、仪器和连接系统。数据被收集并存储在内部或云中的文件系统中。

工程驱动分析的体系结构。

“无论我们的客户在哪个行业,无论他们要求我们分析文本、音频、图像或视频的数据,MATLAB代码都能让我们更快地提供清晰的结果。”

G. Subrahamanya VRK Roo博士,Cognizant

这些数据与来自传统业务系统的数据相结合,如成本数据、销售结果、客户投诉和营销信息。

在此之后,由工程师或领域专家使用MATLAB开发分析。预处理几乎总是需要处理丢失的数据、异常值或其他不可预见的数据质量问题。接下来,使用统计和机器学习等分析方法来生成一个“分析”——系统的预测模型。

为了有用,该预测模型随后被部署到生产IT环境中,提供实时交易或IT系统,如电子商务网站,或嵌入式设备,传感器,控制器,或现实世界中的智能系统,如自动驾驶汽车。

应用MATLAB万博1manbetx®作为该体系结构的一部分是理想的,因为这些工具为使用基于模型的设计(Model-Based Design)的嵌入式系统或使用应用程序部署产品的IT系统提供了简单的部署路径。s manbetx 845

将预测模型部署到嵌入式系统和IT系统。

“MATLAB凭借其强大的数值算法、广泛的可视化和分析工具、可靠的优化例程、对面向对象编程的支持,以及通过我们的生产Java应用程序在云中运行的能力,帮助加速了我们的研发和部署。”万博1manbetx

Borislav Savkovic,首席数据科学家,BuildingIQ