分组变量是用于组公用变量,或分类,观测。分组变量是用于概括或按组可视化数据是有用的。分组变量可以是任何这些数据类型的:
数字矢量
逻辑向量
字符数组
String数组
字符向量的单元阵列
分类矢量
分组变量必须具有相同数目的观测值(行)作为表,数据集阵列,或数字数组您是分组的。具有相同的分组变量值属于同一组的意见。
例如,下面的变量包括相同的基团。每个分组变量分五个观察分为两组。第一组包含第一和第四观测。其他三个观测是第二组中使用。
数据类型 | 分组变量 |
---|---|
数字矢量 | [1 2 2 1 2] |
逻辑向量 | [0 1 1 0 1] |
String数组 | [ “男”, “女”, “女性”, “男”, “女”] |
字符向量的单元阵列 | { '男', '女', '女', '男', '女'} |
分类矢量 | 男女女男女 |
使用分组变量与标签给每个组一个有意义的名字。一个分类矢量是分组变量的有效和灵活的选择。
通常情况下,有许多组在分组变量唯一值。然而,明确的载体可以具有未在该数据表示的水平。的组和组的顺序依赖于分组变量的数据类型。假设G
是分组变量。
如果G
是一个数值或逻辑矢量,则组对应于不同值中G
在唯一值的排序顺序。
如果G
是一个字符数组,字符串数组,或字符向量的单元阵列中,则所述基团对应于不同元件的G
在他们的首次出现的顺序。
如果G
是一个分类矢量,则该基团对应于独特类别层级G
在顺序返回由类别
。
某些功能,如grpstats
中,接受指定为分组变量的单元阵列的多个分组变量,例如,{G1,G2,G3}
。在这种情况下,基团通过值的分组变量唯一组合定义。的顺序由第一分组变量的顺序第一决定,然后通过所述第二分组变量的顺序,等等。
该表列出了可能要使用分组变量来执行常见任务。
分组变量可以有缺失值的前提是你有一个有效的指标。
分组变量数据类型 | 缺少价值指标 |
---|---|
数字矢量 | 为NaN |
逻辑向量 | (不能缺少) |
字符数组 | 空格行 |
String数组 | <缺失> 要么“” |
字符向量的单元阵列 | “” |
分类矢量 | <未定义> |