分组变量 - MATLAB＆Simulink的万博1manbetx - 万博1manbetx,s manbetx 845,万博尤文图斯

文档帮助中心

分组变量

什么是分组变量？

分组变量是用于组公用变量，或分类，观测。分组变量是用于概括或按组可视化数据是有用的。分组变量可以是任何这些数据类型的：

数字矢量
逻辑向量
字符数组
String数组
字符向量的单元阵列
分类矢量

分组变量必须具有相同数目的观测值（行）作为表，数据集阵列，或数字数组您是分组的。具有相同的分组变量值属于同一组的意见。

例如，下面的变量包括相同的基团。每个分组变量分五个观察分为两组。第一组包含第一和第四观测。其他三个观测是第二组中使用。

数据类型	分组变量
数字矢量	`[1 2 2 1 2]`
逻辑向量	`[0 1 1 0 1]`
String数组	`[ “男”， “女”， “女性”， “男”， “女”]`
字符向量的单元阵列	`{ '男'， '女'， '女'， '男'， '女'}`
分类矢量	`男女女男女`

使用分组变量与标签给每个组一个有意义的名字。一个分类矢量是分组变量的有效和灵活的选择。

组定义

通常情况下，有许多组在分组变量唯一值。然而，明确的载体可以具有未在该数据表示的水平。的组和组的顺序依赖于分组变量的数据类型。假设G是分组变量。

如果G是一个数值或逻辑矢量，则组对应于不同值中G在唯一值的排序顺序。
如果G是一个字符数组，字符串数组，或字符向量的单元阵列中，则所述基团对应于不同元件的G在他们的首次出现的顺序。
如果G是一个分类矢量，则该基团对应于独特类别层级G在顺序返回由类别。

某些功能，如grpstats中，接受指定为分组变量的单元阵列的多个分组变量，例如，{G1，G2，G3}。在这种情况下，基团通过值的分组变量唯一组合定义。的顺序由第一分组变量的顺序第一决定，然后通过所述第二分组变量的顺序，等等。

分析使用分组变量

该表列出了可能要使用分组变量来执行常见任务。

任务组	函数接受分组变量
绘制并排侧箱图在不同组的数据。	`箱形图`
绘制与组彩色标记的散点图。	`gscatter`
绘制与组彩色标记的散点图矩阵。	`gplotmatrix`
按组计算汇总统计数据。	`grpstats`
试验组平均值之间的差异。	`anovan`
创建从一个分组变量的索引向量。	`grp2idx`

缺少组值

分组变量可以有缺失值的前提是你有一个有效的指标。

分组变量数据类型	缺少价值指标
数字矢量	`为NaN`
逻辑向量	（不能缺少）
字符数组	空格行
String数组	`<缺失>`要么`“”`
字符向量的单元阵列	`“”`
分类矢量	`<未定义>`

也可以看看

相关的例子

更多关于

统计和机器学习工具箱文档

万博1manbetx

掌握机器学习：有步骤，分步指南与MATLAB

掌握机器学习：有步骤，分步指南与MATLAB

下载电子书