findgroups

发现组和返回组数字

所有的页面崩溃

语法

G = findgroups(一个)

G = findgroups (A1,…)

[G, ID] = findgroups (A)

(G, ID1、…,IDN)= findgroups (A1,…,一个)

G = findgroups (T)

(G, TID) = findgroups (T)

描述

例子

G= findgroups (一个)返回G,创建一个向量组数字分组变量一个。输出参数G包含整数的值从1到N,表明N不同群体的N独特的价值观一个。例如,如果一个是{' b ', ' ', ' ', ' b '},然后findgroups返回G作为[2 1 1 2]。您可以使用G将数据从其他变量组。使用G作为输入参数splitapply在Split-Apply-Combine工作流。

findgroups将向量和空字符南,NaT和未定义的分类值一个失踪的价值和回报南相应的元素G。

例子

G= findgroups (A1,…)创建组数据A1,…,一个。的findgroups函数定义组织的独特的组合值A1,…,一个。例如,如果A1是{' a ', ' a ', ' b ', ' b '}和A2是[0 1 0 0],然后findgroups (A1, A2)返回G作为(1 2 3 3),因为组合“b”0发生两次。

例子

(G,ID)= findgroups (一个)还返回每组的惟一值ID。例如,如果一个是{' b ', ' ', ' ', ' b '},然后findgroups返回G作为[2 1 1 2]和ID作为{' a ', ' b '}。的参数一个和ID是相同的数据类型,但是不需要相同的大小。

例子

(G,ID1、……,IDN)= findgroups (A1,…,一个)也为每个小组在返回唯一的值ID1、…,印度尼西亚。的值在ID1、…,印度尼西亚定义组。例如,如果A1是{' a ', ' a ', ' b ', ' b '}和A2是[0 1 0 0],然后findgroups (A1, A2)返回G作为(1 2 3 3),ID1和ID2下作为{' a ', ' a ', ' b '}和(0 1 0)。

例子

G= findgroups (T)返回G一个向量组数字在表创建的变量T。的findgroups把所有的变量的函数T作为分组变量。

例子

(G,TID)= findgroups (T)同样的回报TID,一个表,其中包含每组的惟一值。TID包含的独特组合值的变量T。中的变量T和TID有相同的名称,但表不需要有相同的行数。

例子

全部折叠

使用组数字分割数据

打开生活的脚本

使用组数字分裂病人身高测量分成了不同的组,性别。然后计算每组的平均高度。

从数据文件加载病人高度和性别patients.mat。

负载病人谁性别高度

类属性名称大小字节性别100 x1 11412细胞高度100 x1 800双

指定组的性别findgroups。

G = findgroups(性别);

比较的前五个元素性别和G。在哪里性别包含“女”,G包含1。在哪里性别包含“男”,G包含2。

性别(1:5)

ans =5 x1细胞{“男性”}{‘男性’}{‘女性’}{‘女性’}{‘女性’}

G (1:5)

ans =5×12 2 1 1 1

分裂高度使用变量分成两组高G。应用的意思是函数。组包含男性和女性患者的平均高度,分别。

splitapply (@mean、身高、G)

ans =2×165.1509 - 69.2340

使用两个变量将数据分组

打开生活的脚本

计算平均血压组患者按性别分组测量和状态作为一个吸烟者。

负载血压读数、性别和吸烟对病人数据从数据文件中patients.mat。

负载病人谁收缩压舒张压性别吸烟者

类属性名称大小字节舒张压100 x1 800双性别100 x1 11412细胞吸烟者100 x1 100逻辑收缩压100 x1 800双

使用性别指定组和吸烟有关病人的信息。G包含从1到4的整数,因为有四种可能的组合值吸烟者和性别。

G = findgroups(吸烟、性别);G (1:10)

ans =10×14 2 1 1 1 1 3 2 2 1

计算每组的平均血压。

meanSystolic = splitapply (@mean,收缩压,G);meanDiastolic = splitapply (@mean,舒张压,G);mBP = [meanSystolic meanDiastolic]

mBP =4×2119.4250 79.0500 119.3462 79.8846 129.0000 89.2308 129.5714 90.3333

在输出表中使用独特的组值

打开生活的脚本

计算组的患者的平均高度,表中显示结果。定义组的患者,使用额外的输出参数findgroups。

从数据文件加载病人高度和性别patients.mat。

负载病人谁性别高度

类属性名称大小字节性别100 x1 11412细胞高度100 x1 800双

指定组的性别findgroups。在输出参数的值性别定义组findgroups发现在分组变量。

(G,性别)= findgroups(性别);

计算的平均高度。创建一个表,其中包含的平均高度。

medianHeight = splitapply (@median、身高、G);T =表(性别、medianHeight)

T =2×2表性别medianHeight __________ _______{‘女性’}65{‘男性’}69

使用来自两个分组变量的惟一值

打开生活的脚本

计算平均血压组患者,表中显示结果。定义组的患者,使用额外的输出参数findgroups。

负载血压读数、性别和吸烟对100名患者的数据从数据文件中patients.mat。

负载病人谁收缩压舒张压性别吸烟者

类属性名称大小字节舒张压100 x1 800双性别100 x1 11412细胞吸烟者100 x1 100逻辑收缩压100 x1 800双

使用性别指定组和吸烟有关病人的信息。计算每组平均血压。输出参数的值性别和吸烟者定义组findgroups发现在分组变量。

(G,性别,吸烟者)= findgroups(性别、吸烟);meanSystolic = splitapply (@mean,收缩压,G);meanDiastolic = splitapply (@mean,舒张压,G);

创建一个表的意思是每个组患者的血压。

T =表(性别、吸烟、meanSystolic meanDiastolic)

T =4×4表性别吸烟者meanSystolic meanDiastolic __________ ______ _______ _________________{‘女性’}假119.42 - 79.05{‘女性’}真129 89.231{‘男性’}假119.35 - 79.885{‘男性’}真正的129.57 - 90.333

集团通过表变量

打开生活的脚本

计算平均血压病人使用分组表中的变量。

性别和吸烟对100名患者的数据加载到一个表。

负载病人T =表(性别、吸烟);:T (1:5)

ans =5×2表性别吸烟者__________ ______{‘男性’}真{‘男性’}假{‘女性’}假{‘女性’}假{‘女性’}假

指定组的病人使用性别和吸烟者变量T。

G = findgroups (T);

计算平均血压的数据变量收缩压和舒张压。

meanSystolic = splitapply (@mean,收缩压,G);meanDiastolic = splitapply (@mean,舒张压,G);mBP = [meanSystolic meanDiastolic]

mBP =4×2119.4250 79.0500 129.0000 89.2308 119.3462 79.8846 129.5714 90.3333

从表并创建输出表

打开生活的脚本

创建一个表的平均血压患者按性别分组和地位抽烟或不抽烟的人。

对患者性别和吸烟的数据加载到一个表。

负载病人T =表(性别、吸烟);

指定组的病人使用性别和吸烟者变量T。输出表TID识别组。

(G, TID) = findgroups (T);TID

TID =4×2表性别吸烟者__________ ______{‘女性’}假{‘女性’}真{‘男性’}假{‘男性’}真

计算平均血压的数据变量收缩压和舒张压。附加平均血压TID。

工业贸易署。的意思是收缩压= splitapply(@mean,Systolic,G); TID.meanDiastolic = splitapply(@mean,Diastolic,G)

TID =4×4表性别吸烟者meanSystolic meanDiastolic __________ ______ _______ _________________{‘女性’}假119.42 - 79.05{‘女性’}真129 89.231{‘男性’}假119.35 - 79.885{‘男性’}真正的129.57 - 90.333

输入参数

全部折叠

`一个`- - - - - -分组变量
向量|单元阵列的特征向量|字符串数组

分组变量指定为一个向量,单元阵列特征向量,或一个字符串数组。独特的价值一个确定组。

如果一个是一个向量,那么它可以是数值或数据类型分类,calendarDuration,datetime,持续时间,逻辑,或字符串。

`T`- - - - - -分组变量
表

分组变量指定为一个表。findgroups对每个表变量作为一个单独的分组变量。的变量可以是数值或数据类型分类,calendarDuration,datetime,持续时间,逻辑,或字符串。

输出参数

全部折叠

`G`——组数字
向量的正整数

组数字,作为一个向量的正整数返回。为N组中确定分组变量,每个整数1和之间N指定一组。G包含南在任何分组变量包含一个空字符向量或一个南,NaT或未定义的分类价值。

如果分组变量向量,那么G和分组变量都是相同的大小。
如果表中的分组变量,的长度G等于表的行数。

`ID`值,确定每组
向量的惟一值|单元阵列的特征向量

值,确定每组,作为特征向量的向量或单元数组返回。的值ID独特的价值排序吗一个。

`TID`——表确定每组的惟一值
表

确定每组的独特的价值观,作为一个表返回。的变量TID有独特的值从相应的变量排序T。然而,TID和T不需要有相同的行数。

扩展功能

高大的数组
计算和数组的行比装入内存。

这个函数支持高阵列的限制:万博1manbetx

不支持高表。万博1manbetx
组数字的顺序G内存相比可能有所不同findgroups计算。

有关更多信息,请参见高内存不足数据数组。

线程环境
在后台运行代码使用MATLAB®`backgroundPool`与并行计算工具箱™或加速代码`ThreadPool`。

这个函数完全支持线程的环境。万博1manbetx有关更多信息,请参见MATLAB函数线程环境中运行。

版本历史

介绍了R2015b

另请参阅

findgroups

语法

描述

例子

使用组数字分割数据

使用两个变量将数据分组

在输出表中使用独特的组值

使用来自两个分组变量的惟一值

集团通过表变量

从表并创建输出表

输入参数

`一个`- - - - - -分组变量
向量|单元阵列的特征向量|字符串数组

`T`- - - - - -分组变量
表

输出参数

`G`——组数字
向量的正整数

`ID`值,确定每组
向量的惟一值|单元阵列的特征向量

`TID`——表确定每组的惟一值
表

更多关于

Split-Apply-Combine工作流

扩展功能

高大的数组
计算和数组的行比装入内存。

线程环境
在后台运行代码使用MATLAB®`backgroundPool`与并行计算工具箱™或加速代码`ThreadPool`。

版本历史

另请参阅

主题

findgroups

语法

描述

例子

使用组数字分割数据

使用两个变量将数据分组

在输出表中使用独特的组值

使用来自两个分组变量的惟一值

集团通过表变量

从表并创建输出表

输入参数

一个- - - - - -分组变量向量|单元阵列的特征向量|字符串数组

T- - - - - -分组变量表

输出参数

G——组数字向量的正整数

ID值,确定每组向量的惟一值|单元阵列的特征向量

TID——表确定每组的惟一值表

更多关于

Split-Apply-Combine工作流

扩展功能

高大的数组计算和数组的行比装入内存。

线程环境在后台运行代码使用MATLAB®backgroundPool与并行计算工具箱™或加速代码ThreadPool。

版本历史

另请参阅

主题

`一个`- - - - - -分组变量
向量|单元阵列的特征向量|字符串数组

`T`- - - - - -分组变量
表

`G`——组数字
向量的正整数

`ID`值,确定每组
向量的惟一值|单元阵列的特征向量

`TID`——表确定每组的惟一值
表

高大的数组
计算和数组的行比装入内存。

线程环境
在后台运行代码使用MATLAB®`backgroundPool`与并行计算工具箱™或加速代码`ThreadPool`。