主要内容

그룹화변수

그룹화변수란?

그룹화변수는관측값을그룹화하거나분류하는데사용되는유틸리티변수입니다。그룹화변수는데이터를그룹별로약하거나시각화할때유용합니다。그룹화변수는다음데이터형중하나일수있습니다。

  • 숫자형벡터

  • 논리형벡터

  • 문자형배열

  • 字符串형배열

  • 문자형벡터로구성된셀형배열

  • 分类형벡터

그룹화변수는그룹화하려는테이블,数据集형배열또는숫자형배열과동일한개수의관측값(행)을가져야합니다。동일한그룹화변수값을갖는관측값은동일한그룹에속합니다。

예를들어,다음변수는동일한그룹을구성합니다。각그룹화변수는5개의관측값을2개의그룹으로나눕니다。첫번째그룹은첫번째관측값과네번째관측값을포함합니다。나머지3개의관측값은두번째그룹에속합니다。

데이터형 그룹화변수
숫자형벡터 [1 2 2 1 2]
논리형벡터 [0 1 1 0 1]
字符串형배열 ["男”、“女”、“女性”,“男”,“女性”)
문자형벡터로구성된셀형배열 {'男','女','女','男','女'}
分类형벡터 男女女男女

그룹화변수를레이블과함께사용하여각그룹에의미있는이름을지정하십시오。直言형벡터를선택하면그룹화변수를효율적이고유연하게사용할수있습니다。

그룹 정의

일반적으로그룹화변수에있는고유한값의개수만큼그룹이존재합니다。그러나直言형벡터는데이터에는나타나지않는레벨을가질수있습니다。그룹과그룹순서는그룹화변수의데이터형에따라결정됩니다。G가그룹화변수라고가정하겠습니다。

  • G가숫자형벡터또는논리형벡터이면그룹은고유한값의정렬된순서에따라G의고유값에대응됩니다。

  • G가문자형배열,弦형배열또는문자형벡터로구성된셀형배열이면그룹은처음으로나타나는순서에따라G의고유값에대응됩니다。

  • G가分类형벡터이면그룹은类别가반환하는순서에따라G의고유한범주레벨에대응됩니다。

grpstats와같은일부함수는그룹화변수로구성된셀형배열로지정된여러개의그룹화변수를받습니다(예:{G1, G2, G3}).이경우그룹은그룹화변수에있는값들의고유한조합에따라정의됩니다。순서는먼저첫번째그룹화변수의순서에의해정해지고,그다음에두번째그룹화변수의순서에의해정해지는식입니다。

그룹화변수를사용한분석

다음@ @에는그룹화변수를사용하여일반적으로수행하는작업이나와있습니다。

그룹화작업 그룹화변수를받는함수
여러그룹에있는데이터에대해상자플롯을나란히그립니다。 箱线图
그룹별로색이지정된마커를사용하여산점도플롯을그립니다。 gscatter
그룹별로색이지정된마커를사용하여산점도플롯행렬을그립니다。 gplotmatrix
그룹별로약통계량을계산합니다。 grpstats
그룹평균간차이를검정합니다。 anovan
그룹화변수로부터덱스벡터를만듭니다。 grp2idx

누락된그룹값

유효한@ @시자를제공할경우그룹화변수는누락값을가질수있습니다。

그룹화변수데이터형 누락값@ @시자
숫자형벡터
논리형벡터 (누락될수없음)
문자형배열 공백 행
字符串형배열 < >失踪또는""
문자형벡터로구성된셀형배열
分类형벡터 <定义>

참고 항목

관련 예제

세부 정보