统计和机器学习工具箱

分析和使用统计和机器学习模型数据

观看视频

下载免费试用版

Statistics and Machine Learning Toolbox™提供用于描述、分析和建模数据的函数和应用程序。您可以使用描述性统计和图表进行探索性数据分析，将概率分布与数据相匹配，为蒙特卡罗模拟生成随机数，并执行假设检验。回归和分类算法使您能够从数据中得出推论并构建预测模型。

对于多维数据分析，统计和机器学习工具箱提供的功能选择，逐步回归，主成分分析（PCA），正规化，和其他降维方法，让您识别变量或功能会影响你的模型。

工具箱提供监督和无监督机器学习算法，包括支持向量机（SVM），升压和袋装决策树，k-最近邻，k均值，K-中心点划分，层次聚类，高斯混合模型，和隐马尔可夫模型。万博1manbetx许多统计和机器学习算法，可用于对数据集是太大而无法存储在内存中的计算。

最新的特性
文档和资源
试用或购买

免费电子书：
掌握机器学习：有步骤，分步指南与MATLAB

现在下载

探索性数据分析

通过交互式图形和描述性统计的统计绘图来探索数据。使用集群识别模式和特性。

可视化

视觉上探索使用概率图，箱形图，直方图，分位数 - 分位数图，以及先进的地块为多变量分析，例如树状图，二维图，并且图安德鲁斯数据。

多元数据可视化

可用统计图概述

箱形图分组数据

可视化高维数据使用随机邻居嵌入

使用多维散点图探索变量之间的关系。

描述性统计

理解和描述潜在的大型数据集的快速使用一些高度相关的数字。

描述性统计概述

按类别分组的汇总统计信息

处理丢失值的数据

使用核平滑函数估计密度

使用分组方法和方差研究数据。

聚类分析

使用k-means、k-medoids、DBSCAN、分级聚类、高斯混合和隐马尔科夫模型对数据进行分组，从而发现模式。

聚类分析概述

与噪声方面的应用基于密度空间聚类（DBSCAN）

使用K-Means发现基因表达谱

使用高斯混合模型聚类

将DBSCAN应用于两个同心组。

特征提取和降维

将原始数据转换为最适合机器学习的特性。迭代地探索和创建新特性，并选择那些优化性能的特性。

特征提取

提取物使用无监督学习技术，如疏滤波和重建ICA数据特征。您还可以使用专门的技术来提取图像，信号文本及数字数据的功能。

特征提取流程

使用计算机视觉工具箱和图像处理工具箱对图像进行特征提取

与信号处理工具箱信号特征提取™

文本数据准备与文本分析工具箱™

影像分类深学特色

从移动设备提供的信号中提取特征。

特征选择

自动识别，在数据建模提供最好的预测能力要素的子集。特征选择方法包括逐步回归，连续特征选择，正则化，和集成方法。

选择用于分类高维数据的特征

通过应用正则化来防止过度拟合

顺序特征选择

使用邻域成分分析(NCA)检测特征进行分类

NCA帮助选择保持模型的大部分准确性的特性。

特征变换和降维

通过将现有的(非分类的)特征转换为新的预测变量来降低维度，在这些预测变量中可以删除描述性较差的特征。特征变换方法包括主成分分析、因子分析和非负矩阵因子分解。

MATLAB和特征变换降维的技术概述^®

使用PCA分析美国城市的生活质量

了解功能转化和选择技巧

PCA项目很多变量在一些正交那些保留大部分的信息。

机器学习

构建使用交互式应用程序的预测分类和回归模型。通过优化的超参数自动选择功能和调整模型。

培训、验证和优化预测模型

比较各种机器学习算法，选择功能，调整超参数，以及评估预测的性能。

与交互式应用程序生成和自动优化预测模型

MATLAB数据分析(55分钟)

用于构建和评估预测模型的最佳实践

5:12

对数据进行分类使用分类学习应用 - 视频

分类

将分类响应变量建模为一个或多个预测器的函数。使用各种参数和非参数分类算法，包括逻辑回归、支持向量机、改进和袋装决策树、朴素贝叶斯、判别分析和k近邻。

在浏览器中尝试分类学习应用程序

使用随机森林进行手写识别

评估使用ROC曲线分类模型(43)

可视化不同分类器的决策曲面

与分类学习应用交互训练分类器。

自动化模型优化

通过自动调整超参数、选择特性和使用代价矩阵解决数据集不平衡问题来提高模型性能。

超参数优化解释(43)

贝叶斯优化工作流程

强大的功能选择使用NCA的回归

自动选择模型和超参数优化在一个步骤

什么是AutoML？

优化的超参数有效地利用贝叶斯优化。

回归和方差分析

模型中的连续响应变量作为一个或多个预测的函数，使用线性和非线性回归，混合效应模型，广义线性模型，和非参数回归。分配差异用方差分析不同的来源。

线性和非线性回归

与多个预测或响应变量从许多线性和非线性回归算法选择复杂的系统模型的行为。配合多层或分层的，线性，非线性，以及广义线性混合效应模型具有嵌套和/或交叉的随机效果来执行纵向或面板的分析，重复测量和生长建模。

在回归学习应用列车回归模型

描述非线性关系

利用MATLAB进行多级混合效果建模(34:44)

学习广义线性模型

飞度回归模型交互与回归学习应用。

非参数回归

产生一个精确的配合，而无需指定，描述预测和应对，包括支持向量机，随机森林，高斯过程，和高斯内核之间的关系的模型。

拟合并优化支持向量机(SVM)回归模型万博1manbetx

用回归随机森林预测保险风险

学习高斯过程回归

使用分位数回归检测异常值

使用分位数回归识别异常值。

方差分析(ANOVA)

将样本方差分配到不同的来源，并确定该方差是在不同的人口组内部还是在不同的人口组之间产生的。采用单因素、双因素、多因素、多因素和非参数方差分析，以及协方差分析(ANOCOVA)和重复测量方差分析(RANOVA)。

介绍单因素方差分析

了解多重比较

多路ANOVA用于均衡与非均衡数据（N-因素ANOVA）

使用多路ANOVA测试组。

概率分布和假设检验

使分布符合数据。分析样本间差异是否显著，是否与随机数据变化一致。从各种分布中生成随机数。

概率分布

适合连续和离散分布，使用统计图评估拟合优度配合，并且计算概率密度函数和累积分布函数为超过40点不同的分布。

使用Distribution Fitter应用程序建模数据

可用概率分布

从多元分布中计算、拟合或生成样本

安装自定义单变量分布

飞度分布交互方式使用分配钳工应用。

随机数生成

从拟合或构造的概率分布中生成伪随机和拟随机数字流。

交互式地生成随机数

准生成随机数

了解蒙特卡罗模拟法

用交点模拟因变量

交互式地生成随机数。

假设检验

对单个、成对或独立样本进行t检验、分布检验(卡方检验、雅克-伯拉检验、利利福尔斯检验和柯尔莫戈罗夫-斯米尔诺夫检验)和非参数检验。测试自校正和随机性，并比较分布(双样本Kolmogorov-Smirnov)。

介绍假设检验

单侧或双侧t检验:检验一个比例或相关性

执行双样本T检验

卡方拟合优度体能测试

在单侧t检验拒绝区域。

工业统计数据

统计分析效果和数据趋势。工业应用统计技术，如实验定制设计和统计过程控制。

试验设计（DOE）

定义，分析和可视化的实验，以定制的设计（DOE）。创建和测试实际计划如何串联处理数据输入生成有关他们的数据输出影响的信息。

介绍计划实验与系统的数据收集

响应面设计，包括箱Behnken法

套用箱Behnken法设计产生更高阶响应面。

统计过程控制（SPC）

监控并通过评估过程变化改进产品或工艺。s manbetx 845创建控制图，估计过程能力，并进行计重复性和再现性研究。

控制图简介

提高发动机冷却风扇采用六西格玛设计技术

监测使用控制图的制造过程。

可靠性和生存分析

通过执行Cox比例风险回归和拟合分布，可视化和分析有和没有截尾的失效时间数据。计算经验风险、幸存者、累积分布函数和核密度估计。

考克斯比例风险模型与时间相关的协变量

使用Kaplan-Meier估计累积危害、存活和累积分布

估计再入院使用Cox比例风险模型

用截尾分析寿命数据

故障数据为“截尾”值的示例。

规模大数据和云计算

应用统计和机器学习技术来进行内存的数据。加快统计计算和集群和云实例机器学习模型训练。

用大数组分析大数据

使用带有许多分类、回归和聚类算法的高数组和表，在不更改代码的情况下，在不适合内存的数据集上训练模型。

模型航班延误对大型数据集采用高大的数组

功能概述支持高大阵列万博1manbetx

卡特彼勒的大数据、数据分析和机器/深度学习基础设施(18:47)

4:13

MATLAB中的高阵列动作视频

并行计算

使用并行化方法加速统计计算和模型训练。

简介并行化机器学习与并行计算工具箱™

了解如何加快运算速度在MATLAB

MATLAB与R基准测试

MATLAB与Python^®基准

加快并行计算工具箱或MATLAB并行服务器™计算。

云计算和分布式计算

使用云实例，加快统计和机器学习计算。请在MATLAB在线整机学习工作流程™。

访问AWS和Azure上的云实例^®具有MATLAB参考架构

在Web浏览器中在线访问MATLAB

在NVIDIA访问云实例^®GPU云

执行对亚马逊或Azure云计算实例。

部署和代码生成

部署统计和机器学习嵌入式系统，加快用C代码计算密集型的计算，并与企业系统集成。

代码生成

使用MATLAB编码器生成可移植和可读的C或c++代码，用于分类和回归算法、描述性统计和概率分布的推理^TM。通过MATLAB函数块和系统块加速使用机器学习模型验证和验证您的高保真仿真。

代码生成工作流概述

使用Coder应用程序为机器学习模型生成C代码

用于分类和代码生成的系统对象™

在Simulink中应用机器学习万博1manbetx^®使用MATLAB功能块

有两种部署方法:生成C代码或编译MATLAB代码。

与应用程序和企业系统集成

将统计和机器学习模型作为独立的、MapReduce、Spark™应用程序、web应用程序和Microsoft部署^®Excel^®使用MATLAB编译器™的外接程序。构建C/ c++共享库、Microsoft .NET程序集、Java^®类和Python^®包使用MATLAB编译SDK™。

在Web应用程序中部署一个电力负荷预测模型

部署人类活动识别智能手机上

使用MATLAB编译器集成了空气质量的分类模型。

更新部署模型

在不重新生成C/ c++预测代码的情况下更新已部署模型的参数。

更新代码生成的模型参数

使用编码器配置程序生成用于预测和更新的代码

代码生成和模型更新工作流。

统计和机器学习工具箱

分析和使用统计和机器学习模型数据

开始:

免费电子书：掌握机器学习：有步骤，分步指南与MATLAB

探索性数据分析

可视化

描述性统计

聚类分析

特征提取和降维

特征提取

特征选择

特征变换和降维

机器学习

培训、验证和优化预测模型

分类

自动化模型优化

回归和方差分析

线性和非线性回归

非参数回归

方差分析(ANOVA)

概率分布和假设检验

概率分布

随机数生成

假设检验

工业统计数据

试验设计（DOE）

统计过程控制（SPC）

可靠性和生存分析

规模大数据和云计算

用大数组分析大数据

并行计算

云计算和分布式计算

部署和代码生成

代码生成

与应用程序和企业系统集成

更新部署模型

最新的特性

自动化机器学习（AutoML）

特征选择

代码生成

代码生成

GPU的万博1manbetx支持

机器学习斜坡弯道

额外的统计和机器学习工具箱资源

获得免费试用

准备买什么?

你是学生吗?

免费电子书：
掌握机器学习：有步骤，分步指南与MATLAB