主要内容

分组变量

分组变量是什么?

分组变量工具变量用于组或分类,观察。分组变量是有用的概括或可视化数据组。一个分组变量可以是任何数据类型:

  • 数值向量

  • 逻辑向量

  • 字符数组

  • 字符串数组

  • 单元阵列的特征向量

  • 分类向量

一个分组变量必须有相同数量的观察表(行),分组数据数组,或数字数组。相同的观察,属于同一个组的分组变量值。

例如,下面的变量组成同一组。每个分组变量5观察分为两组。第一组包含第一和第四的观察。其他三个观察是在第二组。

数据类型 分组变量
数值向量 [1 2 2 1 2]
逻辑向量 (0 1 1 0 1)
字符串数组 ["男”、“女”、“女性”,“男”,“女性”)
单元阵列的特征向量 {'男','女','女','男','女'}
分类向量 男性女性女性男性女性

使用分组变量标签给每组一个有意义的名称。分类向量是一种有效和灵活的选择分组变量。

组定义

通常,有尽可能多的组织惟一值分组变量。然而,分类向量可以有不代表水平数据。团体和团体的顺序取决于分组变量的数据类型。假设G是一个分组变量。

  • 如果G是一个数字或逻辑向量,然后组对应不同值G的顺序,独特的价值观。

  • 如果G是一个字符数组,字符串数组或单元阵列的特征向量,然后组对应不同的元素G在他们的第一次出现的顺序。

  • 如果G是一个分类向量,然后组对应于独特的类别水平呢G在返回的顺序类别

等一些功能grpstats,接受多个分组变量指定为一个单元阵列的分组变量,例如,{G1, G2, G3}。在这种情况下,团体的独特组合值定义的分组变量。订单决定第一顺序的分组变量,然后通过第二个分组变量的顺序,等等。

分析使用分组变量

此表列出了常见的任务你可以执行使用分组变量。

分组的任务 函数接受分组变量
画并排框数据在不同的组块。 箱线图
画一个散点图与彩色标记组。 gscatter
画一个散点图矩阵与标记颜色的组。 gplotmatrix
计算汇总统计的组。 grpstats
测试组之间的差别。 anovan
创建一个索引向量从分组变量。 grp2idx

失踪组值

分组变量可以有缺失值提供了包括一个有效的指标。

分组变量数据类型 缺失值指标
数值向量
逻辑向量 (不能缺少)
字符数组 排空间
字符串数组 <失踪>”“
单元阵列的特征向量
分类向量 <定义>

另请参阅

相关的例子

更多关于