主要内容

findgroups

发现组和返回组数字

描述

例子

G= findgroups (一个)返回G,创建一个向量组数字分组变量一个。输出参数G包含整数的值从1到N,表明N不同群体的N独特的价值观一个。例如,如果一个{' b ', ' ', ' ', ' b '},然后findgroups返回G作为[2 1 1 2]。您可以使用G将数据从其他变量组。使用G作为输入参数splitapplySplit-Apply-Combine工作流

findgroups将向量和空字符,NaT和未定义的分类值一个失踪的价值和回报相应的元素G

例子

G= findgroups (A1,…)创建组数据A1,…,一个。的findgroups函数定义组织的独特的组合值A1,…,一个。例如,如果A1{' a ', ' a ', ' b ', ' b '}A2[0 1 0 0],然后findgroups (A1, A2)返回G作为(1 2 3 3),因为组合“b”0发生两次。

例子

(G,ID)= findgroups (一个)还返回每组的惟一值ID。例如,如果一个{' b ', ' ', ' ', ' b '},然后findgroups返回G作为[2 1 1 2]ID作为{' a ', ' b '}。的参数一个ID是相同的数据类型,但是不需要相同的大小。

例子

(G,ID1、……,IDN)= findgroups (A1,…,一个)也为每个小组在返回唯一的值ID1、…,印度尼西亚。的值在ID1、…,印度尼西亚定义组。例如,如果A1{' a ', ' a ', ' b ', ' b '}A2[0 1 0 0],然后findgroups (A1, A2)返回G作为(1 2 3 3),ID1ID2下作为{' a ', ' a ', ' b '}(0 1 0)

例子

G= findgroups (T)返回G一个向量组数字在表创建的变量T。的findgroups把所有的变量的函数T作为分组变量。

例子

(G,TID)= findgroups (T)同样的回报TID,一个表,其中包含每组的惟一值。TID包含的独特组合值的变量T。中的变量TTID有相同的名称,但表不需要有相同的行数。

例子

全部折叠

使用组数字分裂病人身高测量分成了不同的组,性别。然后计算每组的平均高度。

从数据文件加载病人高度和性别patients.mat

负载病人性别高度
类属性名称大小字节性别100 x1 11412细胞高度100 x1 800双

指定组的性别findgroups

G = findgroups(性别);

比较的前五个元素性别G。在哪里性别包含“女”,G包含1。在哪里性别包含“男”,G包含2

性别(1:5)
ans =5 x1细胞{“男性”}{‘男性’}{‘女性’}{‘女性’}{‘女性’}
G (1:5)
ans =5×12 2 1 1 1

分裂高度使用变量分成两组高G。应用的意思是函数。组包含男性和女性患者的平均高度,分别。

splitapply (@mean、身高、G)
ans =2×165.1509 - 69.2340

计算平均血压组患者按性别分组测量和状态作为一个吸烟者。

负载血压读数、性别和吸烟对病人数据从数据文件中patients.mat

负载病人收缩压舒张压性别吸烟者
类属性名称大小字节舒张压100 x1 800双性别100 x1 11412细胞吸烟者100 x1 100逻辑收缩压100 x1 800双

使用性别指定组和吸烟有关病人的信息。G包含从1到4的整数,因为有四种可能的组合值吸烟者性别

G = findgroups(吸烟、性别);G (1:10)
ans =10×14 2 1 1 1 1 3 2 2 1

计算每组的平均血压。

meanSystolic = splitapply (@mean,收缩压,G);meanDiastolic = splitapply (@mean,舒张压,G);mBP = [meanSystolic meanDiastolic]
mBP =4×2119.4250 79.0500 119.3462 79.8846 129.0000 89.2308 129.5714 90.3333

计算组的患者的平均高度,表中显示结果。定义组的患者,使用额外的输出参数findgroups

从数据文件加载病人高度和性别patients.mat

负载病人性别高度
类属性名称大小字节性别100 x1 11412细胞高度100 x1 800双

指定组的性别findgroups。在输出参数的值性别定义组findgroups发现在分组变量。

(G,性别)= findgroups(性别);

计算的平均高度。创建一个表,其中包含的平均高度。

medianHeight = splitapply (@median、身高、G);T =表(性别、medianHeight)
T =2×2表性别medianHeight __________ _______{‘女性’}65{‘男性’}69

计算平均血压组患者,表中显示结果。定义组的患者,使用额外的输出参数findgroups

负载血压读数、性别和吸烟对100名患者的数据从数据文件中patients.mat

负载病人收缩压舒张压性别吸烟者
类属性名称大小字节舒张压100 x1 800双性别100 x1 11412细胞吸烟者100 x1 100逻辑收缩压100 x1 800双

使用性别指定组和吸烟有关病人的信息。计算每组平均血压。输出参数的值性别吸烟者定义组findgroups发现在分组变量。

(G,性别,吸烟者)= findgroups(性别、吸烟);meanSystolic = splitapply (@mean,收缩压,G);meanDiastolic = splitapply (@mean,舒张压,G);

创建一个表的意思是每个组患者的血压。

T =表(性别、吸烟、meanSystolic meanDiastolic)
T =4×4表性别吸烟者meanSystolic meanDiastolic __________ ______ _______ _________________{‘女性’}假119.42 - 79.05{‘女性’}真129 89.231{‘男性’}假119.35 - 79.885{‘男性’}真正的129.57 - 90.333

计算平均血压病人使用分组表中的变量。

性别和吸烟对100名患者的数据加载到一个表。

负载病人T =表(性别、吸烟);:T (1:5)
ans =5×2表性别吸烟者__________ ______{‘男性’}真{‘男性’}假{‘女性’}假{‘女性’}假{‘女性’}假

指定组的病人使用性别吸烟者变量T

G = findgroups (T);

计算平均血压的数据变量收缩压舒张压

meanSystolic = splitapply (@mean,收缩压,G);meanDiastolic = splitapply (@mean,舒张压,G);mBP = [meanSystolic meanDiastolic]
mBP =4×2119.4250 79.0500 129.0000 89.2308 119.3462 79.8846 129.5714 90.3333

创建一个表的平均血压患者按性别分组和地位抽烟或不抽烟的人。

对患者性别和吸烟的数据加载到一个表。

负载病人T =表(性别、吸烟);

指定组的病人使用性别吸烟者变量T。输出表TID识别组。

(G, TID) = findgroups (T);TID
TID =4×2表性别吸烟者__________ ______{‘女性’}假{‘女性’}真{‘男性’}假{‘男性’}真

计算平均血压的数据变量收缩压舒张压。附加平均血压TID

工业贸易署。的意思是收缩压= splitapply(@mean,Systolic,G); TID.meanDiastolic = splitapply(@mean,Diastolic,G)
TID =4×4表性别吸烟者meanSystolic meanDiastolic __________ ______ _______ _________________{‘女性’}假119.42 - 79.05{‘女性’}真129 89.231{‘男性’}假119.35 - 79.885{‘男性’}真正的129.57 - 90.333

输入参数

全部折叠

分组变量指定为一个向量,单元阵列特征向量,或一个字符串数组。独特的价值一个确定组。

如果一个是一个向量,那么它可以是数值或数据类型分类,calendarDuration,datetime,持续时间,逻辑,或字符串

分组变量指定为一个表。findgroups对每个表变量作为一个单独的分组变量。的变量可以是数值或数据类型分类,calendarDuration,datetime,持续时间,逻辑,或字符串

输出参数

全部折叠

组数字,作为一个向量的正整数返回。为N组中确定分组变量,每个整数1和之间N指定一组。G包含在任何分组变量包含一个空字符向量或一个,NaT或未定义的分类价值。

  • 如果分组变量向量,那么G和分组变量都是相同的大小。

  • 如果表中的分组变量,的长度G等于表的行数。

值,确定每组,作为特征向量的向量或单元数组返回。的值ID独特的价值排序吗一个

确定每组的独特的价值观,作为一个表返回。的变量TID有独特的值从相应的变量排序T。然而,TIDT不需要有相同的行数。

更多关于

全部折叠

Split-Apply-Combine工作流

Split-Apply-Combine工作流是常见的数据分析。在这个工作流,分析师将数据分成组,每组一个函数适用于,并结合结果。图中显示了一个典型的例子工作流和工作流实现的部分findgroupssplitapply

扩展功能

版本历史

介绍了R2015b