分组变量

什么是分组变量?

分组变量是用于组公用变量,或分类,观测。分组变量是用于概括或按组可视化数据是有用的。分组变量可以是任何这些数据类型的:

  • 数字矢量

  • 逻辑向量

  • 字符数组

  • String数组

  • 字符向量的单元阵列

  • 分类矢量

分组变量必须具有相同数目的观测值(行)作为表,数据集阵列,或数字数组您是分组的。具有相同的分组变量值属于同一组的意见。

例如,下面的变量包括相同的基团。每个分组变量分五个观察分为两组。第一组包含第一和第四观测。其他三个观测是第二组中使用。

数据类型 分组变量
数字矢量 [1 2 2 1 2]
逻辑向量 [0 1 1 0 1]
String数组 [ “男”, “女”, “女性”, “男”, “女”]
字符向量的单元阵列 { '男', '女', '女', '男', '女'}
分类矢量 男女女男女

使用分组变量与标签给每个组一个有意义的名字。一个分类矢量是分组变量的有效和灵活的选择。

组定义

通常情况下,有许多组在分组变量唯一值。然而,明确的载体可以具有未在该数据表示的水平。的组和组的顺序依赖于分组变量的数据类型。假设G是分组变量。

  • 如果G是一个数值或逻辑矢量,则组对应于不同值中G在唯一值的排序顺序。

  • 如果G是一个字符数组,字符串数组,或字符向量的单元阵列中,则所述基团对应于不同元件的G在他们的首次出现的顺序。

  • 如果G是一个分类矢量,则该基团对应于独特类别层级G在顺序返回由类别

某些功能,如grpstats中,接受指定为分组变量的单元阵列的多个分组变量,例如,{G1,G2,G3}。在这种情况下,基团通过值的分组变量唯一组合定义。的顺序由第一分组变量的顺序第一决定,然后通过所述第二分组变量的顺序,等等。

分析使用分组变量

该表列出了可能要使用分组变量来执行常见任务。

任务组 函数接受分组变量
绘制并排侧箱图在不同组的数据。 箱形图
绘制与组彩色标记的散点图。 gscatter
绘制与组彩色标记的散点图矩阵。 gplotmatrix
按组计算汇总统计数据。 grpstats
试验组平均值之间的差异。 anovan
创建从一个分组变量的索引向量。 grp2idx

缺少组值

分组变量可以有缺失值的前提是你有一个有效的指标。

分组变量数据类型 缺少价值指标
数字矢量 为NaN
逻辑向量 (不能缺少)
字符数组 空格行
String数组 <缺失>要么“”
字符向量的单元阵列 “”
分类矢量 <未定义>

也可以看看

相关的例子

更多关于