groupsummary
小组总结计算
语法
描述
例子
摘要统计信息
计算统计总表变量。
创建一个表T
包含5个人的信息。
性别= [“男性”;“女性”;“女性”;“男性”;“男性”];年龄=[38,43岁,38;40;49);身高= [71;69;64;67;64);重量= [176;163;131;133;119);T =表(性别、年龄、身高、体重)
T =5×4表性别年龄身高体重________ ___交“男性”38 71 176“女性”43 69 163“女性”38 64 131“男性”40 67 133“男性”49 64 119
计算数量的男性和女性通过指定性别
作为分组变量。
G = groupsummary (T),“性别”)
G =2×2表性别GroupCount ________ __________“女性”2“男性”3
计算出平均年龄、身高和体重的女性和男性分别。
G = groupsummary (T),“性别”,“的意思是”)
G =2×5表性别GroupCount mean_Age mean_Height mean_Weight ________ __________ ________ ___________ ___________的“女性”2 40.5 66.5 42.333 67.333 142.67 147“男性”3
仍然按性别分组,计算平均高度。
G = groupsummary (T),“性别”,“中值”,“高度”)
G =2×3表性别GroupCount median_Height ________ __________ _________________“女性”2 66.5“男性”3 67
多个分组变量
使用两组表数据分组变量。
创建一个表T
包含5个人的信息。
性别= [“男性”;“女性”;“男性”;“女性”;“男性”];吸烟者=逻辑([1,0,1,0,1]);重量= [176;163;131;133;119);T =表(性别、吸烟、体重)
T =5×3表性别吸烟者的体重________交“男性”真正的176“女性”假163“男性”真正的131年“女性”133“男性”真正的119错误
计算平均重量,按性别分组和吸烟状况。默认情况下,两种性别和吸烟状况的组合并不代表输出,因为他们是空的。
G = groupsummary (T) {“性别”,“抽烟”},“的意思是”,“重量”)
G =2×4表性别吸烟者GroupCount mean_Weight ________ ________ __________ ___________的“女性”假2 148“男性”真正的142
设置“IncludeEmptyGroups”
参数值真正的
为了看到所有组组合,包括空的。
G = groupsummary (T) {“性别”,“抽烟”},“的意思是”,“重量”,“IncludeEmptyGroups”,真正的)
G =4×4表性别吸烟者GroupCount mean_Weight ________ ________ __________ ___________的“女性”假148“女性”真南“男性”假0南“男性”真正的142
指定组垃圾箱
组数据根据指定的垃圾箱。
创建一个时间表包含销售信息好几天在一个月之内。
时间戳= datetime ([2017 3 4;2017年3 - 2;2017年3 15;2017年3 10;…2017年3 14;2017年3 31;2017年3 25;…2017年3 29;2017年3 21;2017 3 18]);利润= (2032 3071 1185 2587 1998 2899 3112 909 2619 3085]';TotalItemsSold = [14 13 8 5 10 16 8 6 7 11) ';TT =时间表(时间戳,利润,TotalItemsSold)
TT =10×2时间表时间戳利润TotalItemsSold ___________ ______是_____________ 04 - 3月- 2017年3月14日02 - 2032 - 2017 3071 1185 8 10 - 15 - 3月- 2017年3月14日- 3月- 2017 - 2017 2587 1998 2899 16 25 - 31 - 3月- 2017年3月- 2017 3112 8 29 - 3月21 - 3月- 2017 - 2017 909 2619 3085 18 - 3月- 2017年11
计算平均利润按总分组项目出售,面元组间隔的项目数字。
格式shorteG = groupsummary (TT,“TotalItemsSold”[0 4 8 12 16],“的意思是”,“利润”)
G =3×3表disc_TotalItemsSold GroupCount mean_Profit ___________________ __________ ___________ (4、8) 3.0000 2.0383 e + e + 00 03 [8、12) 4.0000 e + 00 2.3450 e + 03 (12、16) 3.0000 e + 00 2.6673 e + 03
计算平均利润按星期分组。
G = groupsummary (TT,“时间戳”,“dayname”,“的意思是”,“利润”)
G =5×3表dayname_TimeStamps GroupCount mean_Profit _____________ __________ ___________周二2.0000 e + 00 2.3085 e + 03周三周四2.0000 e + 00 1.0470 e + 03 1.0000 e + 00 3.0710 e + 03周五2.0000 e + 00 2.7430 e + 03周六3.0000 e + 00 2.7430 e + 03
集团与矢量数据操作
创建日期和一个向量的向量对应的利润值。
时间戳= datetime ([2017 3 4;2017年3 - 2;2017年3 15;2017年3 10;…2017年3 14;2017年3 31;2017年3 25;…2017年3 29;2017年3 21;2017 3 18]);利润= (2032 3071 1185 2587 1998 2899 3112 909 2619 3085]';
星期计算的平均利润。显示方式,组名,每组的成员数量。
格式shorte[meanDailyProfit, dayOfWeek dailyCounts] = groupsummary(利润,时间戳,“dayname”,“的意思是”)
meanDailyProfit =5×12.3085 e + 03 1.0470 e + 03 3.0710 e + 03 2.7430 e + 03 2.7430 e + 03
dayOfWeek =5 x1分类星期二星期三星期四星期五星期六
dailyCounts =5×12 2 1 2 3
多个分组输入向量的向量
计算平均重量为四组根据他们的性别和吸烟者的地位。
存储病人信息为不同类型的三个向量。
性别= [“男性”;“女性”;“男性”;“女性”;“男性”];吸烟者=逻辑([1,0,1,0,1]);重量= [176;163;131;133;119);
按性别分组和吸烟状况,计算平均重量。B
每组包含的意思是(南
空的组)。BG
是一种含有两个向量描述单元阵列组行你看看他们的元素。例如,第一行BG {1}
说,第一组的患者是女性,和第一行BG {2}
说他们是不吸烟者。最后,公元前
包含成员的数量在每组对应的组织BG
。
[B, BG,公元前]= groupsummary(重量,{性别、吸烟},“的意思是”,“IncludeEmptyGroups”,真正的);B
B =4×1148南南142
BG {1}
ans =4 x1字符串“女性”的“女性”“男性”“男性”
BG {2}
ans =4 x1逻辑阵列0 1 0 1
公元前
公元前=4×12 0 0 3
函数处理多个输入方法
数据加载包含患者信息和创建一个表描述每个病人的性别、收缩压和舒张压,身高和体重。
负载病人T =表(性别、收缩压、舒张压、身高、体重)
T =100×5表性别收缩压舒张压高出生体重__________ ________ ____{‘男性’}176{‘男性’}109 124 93 71 77 69 163{‘女性’}131{‘女性’}117 125 83 64 75 67 133{‘女性’}119{‘女性’}121 122 80 64 70 68 142{‘女性’}142{‘男性’}115 130 88 64 82 68 180{‘男性’}183{‘女性’}118 115 78 68 86 66 132{‘女性’}128{‘女性’}115 114 77 68 68 66 137{‘男性’}174{‘男性’}130 127 74 71 95 72 202{‘女性’}129{‘男性’}130 114 79 65 92 71 181⋮
按性别分组,计算患者身高和体重之间的关系和收缩压和舒张压之间的关系。使用xcov
计算相关函数的方法。前两个输入参数xcov
描述数据关联,第三个参数描述了滞后大小和第四个参数描述了标准化的类型。每组计算的x
和y
参数传递给xcov
指定的变量两两两个细胞元素(“高度”、“收缩”)
和(“重量”、“舒张期”)
。
G = groupsummary (T),“性别”@ (x, y) xcov (x, y, 0,多项式系数的),{[“高度”,“收缩”]、[“重量”,“舒张期”]})
G =2×4表性别GroupCount fun1_Height_Weight fun1_Systolic_Diastolic __________ __________ _____________ _______________________{‘女性’}53 0.071278 - 0.48731{‘男性’}47 0.047571 - 0.50254
另外,如果您的数据是在向量或矩阵形式,而不是在一个表,你可以提供相关的数据的第一个输入参数groupsummary
。
(G, GR, GC) = groupsummary({(身高、收缩),(重量、舒张压)},性别,@ (x, y) xcov (x, y, 0,多项式系数的))
G =2×20.0713 0.4873 0.0476 0.5025
GR =2 x1细胞{'女'}{‘男性’}
GC =2×153个47
输入参数
T
- - - - - -输入数据
表|时间表
输入数据,指定为一个表或时间表。
一个
- - - - - -输入数组
向量|矩阵|单元阵列
输入数组,指定为一个向量,矩阵或向量或矩阵单元阵列。
当你指定一个函数处理方法
这需要多个输入参数,输入数据一个
必须是一个单元阵列的向量或矩阵。在每次调用函数组,输入参数的相应列单元阵列中的每个元素。例如:
groupvars groupsummary ({(x1, y1)}, @ (x, y) myFun (x, y))
计算myFun (x1, y1)
为每个组。groupsummary ({(x1, x2)), (y1 y2)}, groupvars, @ (x, y) myFun (x, y))
第一次计算myFun (x1, y1)
对于每一个组,然后计算myFun (x2, y2)
为每个组。
groupvars
- - - - - -分组变量或向量
标量|向量|矩阵|单元阵列|函数处理|表vartype
下标
分组变量或向量,指定这些选项之一:
对数组输入,
groupvars
可以是一个列向量与相同数量的行吗一个
或一组列向量排列在一个矩阵或单元阵列。输入表或时间表,
groupvars
表示使用哪个变量计算组的数据。您可以指定的分组变量在这个表格的任何选项。选项 描述 例子 标量变量名称 一个特征向量或标量字符串指定单个表变量名。
“Var1”
“Var1”
向量的变量名 特征向量的单元阵列或字符串数组,其中每个元素是一个表变量名。
{“Var1”“Var2”}
[" Var1”“Var2”)
标量或矢量变量指标 一个标量或矢量表变量指标。
1
[1 3 5]
逻辑标量或矢量 逻辑向量的每个元素对应一个表变量
真正的
包括相应的变量假
不包括它。(真的假的真的)
函数处理 一个函数处理,表变量作为输入,并返回一个逻辑标量。
@isnumeric
vartype
下标表生成的下标
vartype
函数。vartype(数字)
例子:groupsummary (T,“Var3”)
方法
- - - - - -计算方法
“和”
|“的意思是”
|“中值”
|“模式”
|“var”
|“性病”
|“最小值”
|“马克斯”
|“范围”
|“nummissing”
|“nnz”
|“所有”
|函数处理|单元阵列
计算方法,指定为以下之一:
“和”
——总和“的意思是”
——意思是“中值”
——中值“模式”
——模式“var”
——方差“性病”
——标准偏差“最小值”
——最低“马克斯”
——最大“范围”
——最大-最小“nummissing”
——缺失的元素的数量“nnz”
——数量的非零和非南
元素“所有”
——所有计算之前上市
你也可以指定方法
作为处理函数,它返回一个实体每组的第一个维度的长度是1。对于表输入数据,分别作用于每个表变量的函数。
当输入数据是一张桌子T
你指定一个函数处理方法
这需要多个输入参数,您必须指定datavars
。的datavars
参数必须是一个单元阵列的元素指示表为每个输入变量的使用方法。在每次调用函数组,输入参数是细胞的数组元素对应的表变量。例如:
groupsummary (T groupvars @ (x, y) myFun (x, y), {“x1”、“日元”})
计算myFun (T.x1 T.y1)
为每个组。groupsummary (T groupvars @ (x, y) myFun (x, y), {(“x1”“x2”)(“日元”“y2)})
第一次计算myfun (T.x1 T.y1)
对于每一个组,然后计算myfun (T.x2 T.y2)
为每个组。
当输入数据向量或矩阵形式,您指定一个函数处理方法
这需要多个输入参数,输入数据一个
必须是一个单元阵列的向量或矩阵。在每次调用函数,输入参数的相应列单元阵列中的每个元素。例如:
groupvars groupsummary ({(x1, y1)}, @ (x, y) myFun (x, y))
计算myFun (x1, y1)
为每个组。groupsummary ({(x1, x2)), (y1 y2)}, groupvars, @ (x, y) myFun (x, y))
第一次计算myFun (x1, y1)
对于每一个组,然后计算myFun (x2, y2)
为每个组。
指定多个计算一次,单元阵列中的选项列表,等{“的意思是”,“中等”}
或{myFun1, myFun2}
。
南
值在输入数据时自动省略使用这里描述的方法名,除了“nummissing”
。包括南
值,考虑使用一个函数处理的方法,如@sum
而不是“和”
。
数据类型:字符
|字符串
|细胞
|function_handle
datavars
- - - - - -表变量来操作
标量|向量|单元阵列|函数处理|表vartype
下标
表变量操作,指定为这个表的选项之一。datavars
显示变量的输入表或时间表应用方法。其他变量没有规定datavars
不动手术,不通过输出。当datavars
没有指定,groupsummary
作用于每个nongrouping变量。
选项 | 描述 | 例子 |
---|---|---|
变量名 | 一个特征向量或标量字符串指定单个表变量名 |
|
向量的变量名 | 特征向量的单元阵列或字符串数组,其中每个元素是一个表变量名 |
|
标量或矢量变量指标 | 一个标量或矢量表变量指标 |
|
逻辑向量 | 逻辑向量的每个元素对应一个表变量 |
|
函数处理 | 一个函数处理,表变量作为输入,并返回一个逻辑标量 |
|
vartype 下标 |
表生成的下标 |
|
当输入数据是一张桌子T
你指定一个函数处理方法
这需要多个输入参数,您必须指定datavars
。的datavars
参数必须是一个单元阵列的元素表中的任何选项。细胞数组元素指示表为每个输入变量的使用方法。在每次调用函数组,输入参数是细胞的数组元素对应的表变量。例如:
groupsummary (T groupvars @ (x, y) myFun (x, y), {“x1”、“日元”})
计算myFun (T.x1 T.y1)
为每个组。groupsummary (T groupvars @ (x, y) myFun (x, y), {(“x1”“x2”)(“日元”“y2)})
第一次计算myfun (T.x1 T.y1)
对于每一个组,然后计算myfun (T.x2 T.y2)
为每个组。
例子:groupsummary (T groupvars方法,(“Var1”“Var2”“Var4”])
groupbins
- - - - - -装箱计划
“没有”
(默认)|向量|标量|单元阵列
装箱计划,指定为以下选项之一:
“没有”
,表明没有装箱本边缘的列表,指定为一个数值向量,或
datetime
向量为datetime
分组变量或向量一些垃圾箱,指定为一个整数标量
时间,指定为一个标量类型
持续时间
或calendarDuration
表明本宽度(datetime
或持续时间
分组变量或向量)时间本
datetime
和持续时间
指定分组变量或向量,如以下的其中一个特征向量:价值 描述 数据类型 “第二”
每本1秒。
datetime
和持续时间
“一分钟”
每本1分钟。
datetime
和持续时间
“小时”
每箱是1小时。
datetime
和持续时间
“天”
每本1日历天。这个值占夏令时的转变。
datetime
和持续时间
“周”
每一本日历是1周。 datetime
只有“月”
每本1日历月。 datetime
只有“季”
每箱是1季度。 datetime
只有“年”
每本是1年。这个值占飞跃天。
datetime
和持续时间
“十年”
每本十年是1(10个日历年)。 datetime
只有“世纪”
每本1世纪(100日历年)。 datetime
只有“secondofminute”
箱子从0到59秒。
datetime
只有“minuteofhour”
箱子从0到59分钟。
datetime
只有“hourofday”
箱子从0到23小时。
datetime
只有“dayofweek”
箱子从1到7天。一周的第一天是星期天。
datetime
只有“dayname”
垃圾箱是一整天的名字等 “星期天”
。datetime
只有“dayofmonth”
箱子从1到31天。 datetime
只有“dayofyear”
箱子从1到366天。 datetime
只有“weekofmonth”
箱子从1到6周。 datetime
只有“weekofyear”
箱子从1 - 54周。 datetime
只有“monthname”
箱子里满是如月的名字 “1月”
。datetime
只有“monthofyear”
箱子从1到12个月。
datetime
只有“quarterofyear”
箱子从1到4季度。 datetime
只有单元阵列清单装箱规则为每个分组变量或向量
当多个指定分组变量,您可以提供一个装箱规则适用于所有分组变量,或一个细胞数组包含为每个分组变量,如装箱方法{“没有”,[0 2 4正]}
。
名称-值参数
指定可选的双参数作为Name1 = Value1,…,以=家
,在那里的名字
参数名称和吗价值
相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。
R2021a之前,用逗号来分隔每一个名称和值,并附上的名字
在报价。
例子:G = groupsummary (T groupvars groupbins,‘IncludedEdge’,‘正确的’)
IncludedEdge
- - - - - -包括本边缘
“左”
(默认)|“对”
包括本边缘,指定为“左”
或“对”
,表明本间隔的包容性。
这个名称-值对只能时指定groupbins
指定,值是适用于所有装箱计划为所有分组变量或向量。
IncludeMissingGroups
- - - - - -失踪组指标
真正的
(默认)|假
失踪组指标,指定为真正的
或假
。当参数值真正的
,groupsummary
显示组织的缺失值,如南
。当参数值假
,groupsummary
不显示缺失组。
数据类型:逻辑
IncludeEmptyGroups
- - - - - -空的组指标
假
(默认)|真正的
空集团指标,指定为真正的
或假
。当参数值假
,groupsummary
不显示组与零元素。当参数值真正的
,groupsummary
显示空的组。
数据类型:逻辑
输出参数
G
——输出表
表
输出表,返回包含指定的计算为每个组表。
B
——输出数组
向量|矩阵
输出数组,返回包含组计算的向量或矩阵。当你指定多个方法,groupsummary
横向连接计算的顺序列出。
BG
——组
列向量|单元阵列的列向量
组输入数据数组,返回为一个列向量或单元阵列的列向量对应一组向量。
当你提供多个分组向量,BG
是一个单元阵列包含列向量的长度相等。组信息可以通过查看行中所有向量的元素BG
。每一组映射到相应的行输出的数组B
。
公元前
——组数
列向量
集团统计数组输入数据,作为一个列向量返回包含元素在每组的数量。的长度公元前
是一样的返回的列向量组的长度BG
。
提示
打很多电话的时候出现
groupsummary
,可以考虑将分组变量转换为类型分类
或逻辑
在可能的情况下提高性能。例如,如果你有一个分组类型的变量字符
(如性别
与元素“男”
和“女”
),您可以使用命令转换成绝对价值分类(性别)
。
扩展功能
高大的数组
计算和数组的行比装入内存。
使用笔记和限制:
如果
一个
和groupvars
都是高大的矩阵,然后他们必须有相同数量的行。如果第一个输入是一个高大的矩阵,那么
groupvars
可以是一个单元阵列包含高分组向量。的
groupvars
和datavars
参数不支持函数处理。万博1manbetx的
IncludeEmptyGroups
不支持名称参数。万博1manbetx的
“中值”
和“模式”
不支持方法。万博1manbetx对于高datetime数组,
“性病”
不支持方法。万博1manbetx如果
方法
参数是一个函数处理,那么它必须是一个有效的输入splitapply
操作在一个高大的数组。如果函数处理多个输入,然后第一个输入groupsummary
必须是一个高大的表。组的顺序可能不同与内存相比
groupsummary
计算。分组时离散datetime数组、分类组名称不同而内存中
groupsummary
计算。
有关更多信息,请参见高大的数组。
C / c++代码生成
生成C和c++代码使用MATLAB®编码器™。
使用笔记和限制:
不支持输入稀疏。万博1manbetx
装箱方案不支持datetime或持续时间数据万博1manbetx。
输入数据的异构单元阵列大小可变的内容不支持。万博1manbetx
输入表包含
N
维数组不支持。万博1manbetx输入数据包含细胞阵列特征向量或不支持细胞阵列的细胞阵列。万博1manbetx
计算方法必须是常数。
分组变量必须是常数时,第一个输入参数是一个表。
数据变量必须是常数。
装箱计划指定为特征向量或字符串必须是常数。
名称-值参数必须是常数。
不能返回稀疏或计算方法
N
维的结果。如果组变量的数量可以在运行时改变,第二个输出
BG
是一个单元阵列。
线程环境
在后台运行代码使用MATLAB®backgroundPool
与并行计算工具箱™或加速代码ThreadPool
。
这个函数完全支持线程的环境。万博1manbetx有关更多信息,请参见MATLAB函数线程环境中运行。
版本历史
介绍了R2018aR2022a:通过小组的大小来改善性能
的groupsummary
函数显示了改进的性能,特别是当数据统计每组小。
R2022a:接受数据类型没有标准缺失值
行为改变R2022a
的nummissing
和nnz
方法不再错误输入数据类型没有违约的定义一个标准的缺失值。
MATLAB代码依赖于错误扔的输入,例如代码内试一试
/抓
块,可能不再捕捉这些错误。
Abrir比如
这种版本modificada德埃斯特比如。害怕Desea abrir埃斯特比如con sus modificaciones吗?
第一de MATLAB
Ha事实clic en联合国围绕此时一个埃斯特第一de MATLAB:
Ejecute el第一introduciendolo en la ventana de第一de MATLAB。洛杉矶navegadores网络没有admiten第一de MATLAB。
你也可以从下面的列表中选择一个网站:
表现最好的网站怎么走吗
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。