分组变量工具变量用于组或分类,观察。分组变量是有用的概括或可视化数据组。一个分组变量可以是任何数据类型:
数值向量
逻辑向量
字符数组
字符串数组
单元阵列的特征向量
分类向量
一个分组变量必须有相同数量的观察表(行),分组数据数组,或数字数组。相同的观察,属于同一个组的分组变量值。
例如,下面的变量组成同一组。每个分组变量5观察分为两组。第一组包含第一和第四的观察。其他三个观察是在第二组。
数据类型 | 分组变量 |
---|---|
数值向量 | [1 2 2 1 2] |
逻辑向量 | (0 1 1 0 1) |
字符串数组 | ["男”、“女”、“女性”,“男”,“女性”) |
单元阵列的特征向量 | {'男','女','女','男','女'} |
分类向量 | 男性女性女性男性女性 |
使用分组变量标签给每组一个有意义的名称。分类向量是一种有效和灵活的选择分组变量。
通常,有尽可能多的组织惟一值分组变量。然而,分类向量可以有不代表水平数据。团体和团体的顺序取决于分组变量的数据类型。假设G
是一个分组变量。
如果G
是一个数字或逻辑向量,然后组对应不同值G
的顺序,独特的价值观。
如果G
是一个字符数组,字符串数组或单元阵列的特征向量,然后组对应不同的元素G
在他们的第一次出现的顺序。
如果G
是一个分类向量,然后组对应于独特的类别水平呢G
在返回的顺序类别
。
等一些功能grpstats
,接受多个分组变量指定为一个单元阵列的分组变量,例如,{G1, G2, G3}
。在这种情况下,团体的独特组合值定义的分组变量。订单决定第一顺序的分组变量,然后通过第二个分组变量的顺序,等等。
此表列出了常见的任务你可以执行使用分组变量。
分组变量可以有缺失值提供了包括一个有效的指标。
分组变量数据类型 | 缺失值指标 |
---|---|
数值向量 | 南 |
逻辑向量 | (不能缺少) |
字符数组 | 排空间 |
字符串数组 | <失踪> 或”“ |
单元阵列的特征向量 | ” |
分类向量 | <定义> |