主要内容

groupsummary

小组总结计算

描述

例子

G= groupsummary (T,groupvars)返回一个表,其中包含计算组和元素的数量在每组数据表或时间表T。一组包含的独特组合分组变量groupvars。例如,G = groupsummary (T '性别')返回的数量男性元素的数量元素的变量性别

例子

G= groupsummary (T,groupvars,方法)返回指定的计算方法。例如,G = groupsummary (T,“性别”,“中值”)返回所有nongrouping变量的值T对男女双方来说,除了在每组元素的数量。

例子

G= groupsummary (T,groupvars,方法,datavars)计算应用于指定变量。

G= groupsummary (T,groupvars,groupbins)指定如何本中的数据groupvars。例如,G = groupsummary (T,‘SaleDate’,‘年’)给所有销售的组数T在每年根据分组变量SaleDate

G= groupsummary (T,groupvars,groupbins,方法)根据箱数据groupbins中指定的计算方法

例子

G= groupsummary (T,groupvars,groupbins,方法,datavars)根据箱数据groupbins并指定应用计算的变量。

例子

G= groupsummary (___,名称,值)指定附加的分组属性使用一个或多个名称-值参数的任何以前的语法。例如,G = groupsummary (T,‘Category1’,‘IncludeMissingGroups’,假)排除了集团由失踪分类数据显示,<定义>

B= groupsummary (一个,groupvars,方法)返回向量计算根据分组的独特组合groupvars一个是一个向量或矩阵。groupvars可以是一个列向量、矩阵或单元阵列的列向量。

例子

B= groupsummary (一个,groupvars,groupbins,方法)根据箱数据groupbins

例子

B= groupsummary (___,名称,值)指定附加的分组属性使用一个或多个名称参数前面的数组的语法。

(B,BG)= groupsummary (一个,___)也为每个分组返回组向量。

例子

(B,BG,公元前)= groupsummary (一个,___)还返回组计数为每个组。

例子

全部折叠

计算统计总表变量。

创建一个表T包含5个人的信息。

性别= [“男性”;“女性”;“女性”;“男性”;“男性”];年龄=[38,43岁,38;40;49);身高= [71;69;64;67;64);重量= [176;163;131;133;119);T =表(性别、年龄、身高、体重)
T =5×4表性别年龄身高体重________ ___交“男性”38 71 176“女性”43 69 163“女性”38 64 131“男性”40 67 133“男性”49 64 119

计算数量的男性和女性通过指定性别作为分组变量。

G = groupsummary (T),“性别”)
G =2×2表性别GroupCount ________ __________“女性”2“男性”3

计算出平均年龄、身高和体重的女性和男性分别。

G = groupsummary (T),“性别”,“的意思是”)
G =2×5表性别GroupCount mean_Age mean_Height mean_Weight ________ __________ ________ ___________ ___________的“女性”2 40.5 66.5 42.333 67.333 142.67 147“男性”3

仍然按性别分组,计算平均高度。

G = groupsummary (T),“性别”,“中值”,“高度”)
G =2×3表性别GroupCount median_Height ________ __________ _________________“女性”2 66.5“男性”3 67

使用两组表数据分组变量。

创建一个表T包含5个人的信息。

性别= [“男性”;“女性”;“男性”;“女性”;“男性”];吸烟者=逻辑([1,0,1,0,1]);重量= [176;163;131;133;119);T =表(性别、吸烟、体重)
T =5×3表性别吸烟者的体重________交“男性”真正的176“女性”假163“男性”真正的131年“女性”133“男性”真正的119错误

计算平均重量,按性别分组和吸烟状况。默认情况下,两种性别和吸烟状况的组合并不代表输出,因为他们是空的。

G = groupsummary (T) {“性别”,“抽烟”},“的意思是”,“重量”)
G =2×4表性别吸烟者GroupCount mean_Weight ________ ________ __________ ___________的“女性”假2 148“男性”真正的142

设置“IncludeEmptyGroups”参数值真正的为了看到所有组组合,包括空的。

G = groupsummary (T) {“性别”,“抽烟”},“的意思是”,“重量”,“IncludeEmptyGroups”,真正的)
G =4×4表性别吸烟者GroupCount mean_Weight ________ ________ __________ ___________的“女性”假148“女性”真南“男性”假0南“男性”真正的142

组数据根据指定的垃圾箱。

创建一个时间表包含销售信息好几天在一个月之内。

时间戳= datetime ([2017 3 4;2017年3 - 2;2017年3 15;2017年3 10;2017年3 14;2017年3 31;2017年3 25;2017年3 29;2017年3 21;2017 3 18]);利润= (2032 3071 1185 2587 1998 2899 3112 909 2619 3085]';TotalItemsSold = [14 13 8 5 10 16 8 6 7 11) ';TT =时间表(时间戳,利润,TotalItemsSold)
TT =10×2时间表时间戳利润TotalItemsSold ___________ ______是_____________ 04 - 3月- 2017年3月14日02 - 2032 - 2017 3071 1185 8 10 - 15 - 3月- 2017年3月14日- 3月- 2017 - 2017 2587 1998 2899 16 25 - 31 - 3月- 2017年3月- 2017 3112 8 29 - 3月21 - 3月- 2017 - 2017 909 2619 3085 18 - 3月- 2017年11

计算平均利润按总分组项目出售,面元组间隔的项目数字。

格式shorteG = groupsummary (TT,“TotalItemsSold”[0 4 8 12 16],“的意思是”,“利润”)
G =3×3表disc_TotalItemsSold GroupCount mean_Profit ___________________ __________ ___________ (4、8) 3.0000 2.0383 e + e + 00 03 [8、12) 4.0000 e + 00 2.3450 e + 03 (12、16) 3.0000 e + 00 2.6673 e + 03

计算平均利润按星期分组。

G = groupsummary (TT,“时间戳”,“dayname”,“的意思是”,“利润”)
G =5×3表dayname_TimeStamps GroupCount mean_Profit _____________ __________ ___________周二2.0000 e + 00 2.3085 e + 03周三周四2.0000 e + 00 1.0470 e + 03 1.0000 e + 00 3.0710 e + 03周五2.0000 e + 00 2.7430 e + 03周六3.0000 e + 00 2.7430 e + 03

创建日期和一个向量的向量对应的利润值。

时间戳= datetime ([2017 3 4;2017年3 - 2;2017年3 15;2017年3 10;2017年3 14;2017年3 31;2017年3 25;2017年3 29;2017年3 21;2017 3 18]);利润= (2032 3071 1185 2587 1998 2899 3112 909 2619 3085]';

星期计算的平均利润。显示方式,组名,每组的成员数量。

格式shorte[meanDailyProfit, dayOfWeek dailyCounts] = groupsummary(利润,时间戳,“dayname”,“的意思是”)
meanDailyProfit =5×12.3085 e + 03 1.0470 e + 03 3.0710 e + 03 2.7430 e + 03 2.7430 e + 03
dayOfWeek =5 x1分类星期二星期三星期四星期五星期六
dailyCounts =5×12 2 1 2 3

计算平均重量为四组根据他们的性别和吸烟者的地位。

存储病人信息为不同类型的三个向量。

性别= [“男性”;“女性”;“男性”;“女性”;“男性”];吸烟者=逻辑([1,0,1,0,1]);重量= [176;163;131;133;119);

按性别分组和吸烟状况,计算平均重量。B每组包含的意思是(空的组)。BG是一种含有两个向量描述单元阵列组行你看看他们的元素。例如,第一行BG {1}说,第一组的患者是女性,和第一行BG {2}说他们是不吸烟者。最后,公元前包含成员的数量在每组对应的组织BG

[B, BG,公元前]= groupsummary(重量,{性别、吸烟},“的意思是”,“IncludeEmptyGroups”,真正的);B
B =4×1148南南142
BG {1}
ans =4 x1字符串“女性”的“女性”“男性”“男性”
BG {2}
ans =4 x1逻辑阵列0 1 0 1
公元前
公元前=4×12 0 0 3

数据加载包含患者信息和创建一个表描述每个病人的性别、收缩压和舒张压,身高和体重。

负载病人T =表(性别、收缩压、舒张压、身高、体重)
T =100×5表性别收缩压舒张压高出生体重__________ ________ ____{‘男性’}176{‘男性’}109 124 93 71 77 69 163{‘女性’}131{‘女性’}117 125 83 64 75 67 133{‘女性’}119{‘女性’}121 122 80 64 70 68 142{‘女性’}142{‘男性’}115 130 88 64 82 68 180{‘男性’}183{‘女性’}118 115 78 68 86 66 132{‘女性’}128{‘女性’}115 114 77 68 68 66 137{‘男性’}174{‘男性’}130 127 74 71 95 72 202{‘女性’}129{‘男性’}130 114 79 65 92 71 181⋮

按性别分组,计算患者身高和体重之间的关系和收缩压和舒张压之间的关系。使用xcov计算相关函数的方法。前两个输入参数xcov描述数据关联,第三个参数描述了滞后大小和第四个参数描述了标准化的类型。每组计算的xy参数传递给xcov指定的变量两两两个细胞元素(“高度”、“收缩”)(“重量”、“舒张期”)

G = groupsummary (T),“性别”@ (x, y) xcov (x, y, 0,多项式系数的),{[“高度”,“收缩”]、[“重量”,“舒张期”]})
G =2×4表性别GroupCount fun1_Height_Weight fun1_Systolic_Diastolic __________ __________ _____________ _______________________{‘女性’}53 0.071278 - 0.48731{‘男性’}47 0.047571 - 0.50254

另外,如果您的数据是在向量或矩阵形式,而不是在一个表,你可以提供相关的数据的第一个输入参数groupsummary

(G, GR, GC) = groupsummary({(身高、收缩),(重量、舒张压)},性别,@ (x, y) xcov (x, y, 0,多项式系数的))
G =2×20.0713 0.4873 0.0476 0.5025
GR =2 x1细胞{'女'}{‘男性’}
GC =2×153个47

输入参数

全部折叠

输入数据,指定为一个表或时间表。

输入数组,指定为一个向量,矩阵或向量或矩阵单元阵列。

当你指定一个函数处理方法这需要多个输入参数,输入数据一个必须是一个单元阵列的向量或矩阵。在每次调用函数组,输入参数的相应列单元阵列中的每个元素。例如:

  • groupvars groupsummary ({(x1, y1)}, @ (x, y) myFun (x, y))计算myFun (x1, y1)为每个组。

  • groupsummary ({(x1, x2)), (y1 y2)}, groupvars, @ (x, y) myFun (x, y))第一次计算myFun (x1, y1)对于每一个组,然后计算myFun (x2, y2)为每个组。

分组变量或向量,指定这些选项之一:

  • 对数组输入,groupvars可以是一个列向量与相同数量的行吗一个或一组列向量排列在一个矩阵或单元阵列。

  • 输入表或时间表,groupvars表示使用哪个变量计算组的数据。您可以指定的分组变量在这个表格的任何选项。

    选项 描述 例子
    标量变量名称

    一个特征向量或标量字符串指定单个表变量名。

    “Var1”

    “Var1”

    向量的变量名

    特征向量的单元阵列或字符串数组,其中每个元素是一个表变量名。

    {“Var1”“Var2”}

    [" Var1”“Var2”)

    标量或矢量变量指标

    一个标量或矢量表变量指标。

    1

    [1 3 5]

    逻辑标量或矢量

    逻辑向量的每个元素对应一个表变量真正的包括相应的变量不包括它。

    (真的假的真的)

    函数处理

    一个函数处理,表变量作为输入,并返回一个逻辑标量。

    @isnumeric

    vartype下标

    表生成的下标vartype函数。

    vartype(数字)

例子:groupsummary (T,“Var3”)

计算方法,指定为以下之一:

  • “和”——总和

  • “的意思是”——意思是

  • “中值”——中值

  • “模式”——模式

  • “var”——方差

  • “性病”——标准偏差

  • “最小值”——最低

  • “马克斯”——最大

  • “范围”——最大-最小

  • “nummissing”——缺失的元素的数量

  • “nnz”——数量的非零和非元素

  • “所有”——所有计算之前上市

你也可以指定方法作为处理函数,它返回一个实体每组的第一个维度的长度是1。对于表输入数据,分别作用于每个表变量的函数。

当输入数据是一张桌子T你指定一个函数处理方法这需要多个输入参数,您必须指定datavars。的datavars参数必须是一个单元阵列的元素指示表为每个输入变量的使用方法。在每次调用函数组,输入参数是细胞的数组元素对应的表变量。例如:

  • groupsummary (T groupvars @ (x, y) myFun (x, y), {“x1”、“日元”})计算myFun (T.x1 T.y1)为每个组。

  • groupsummary (T groupvars @ (x, y) myFun (x, y), {(“x1”“x2”)(“日元”“y2)})第一次计算myfun (T.x1 T.y1)对于每一个组,然后计算myfun (T.x2 T.y2)为每个组。

当输入数据向量或矩阵形式,您指定一个函数处理方法这需要多个输入参数,输入数据一个必须是一个单元阵列的向量或矩阵。在每次调用函数,输入参数的相应列单元阵列中的每个元素。例如:

  • groupvars groupsummary ({(x1, y1)}, @ (x, y) myFun (x, y))计算myFun (x1, y1)为每个组。

  • groupsummary ({(x1, x2)), (y1 y2)}, groupvars, @ (x, y) myFun (x, y))第一次计算myFun (x1, y1)对于每一个组,然后计算myFun (x2, y2)为每个组。

指定多个计算一次,单元阵列中的选项列表,等{“的意思是”,“中等”}{myFun1, myFun2}

值在输入数据时自动省略使用这里描述的方法名,除了“nummissing”。包括值,考虑使用一个函数处理的方法,如@sum而不是“和”

数据类型:字符|字符串|细胞|function_handle

表变量操作,指定为这个表的选项之一。datavars显示变量的输入表或时间表应用方法。其他变量没有规定datavars不动手术,不通过输出。当datavars没有指定,groupsummary作用于每个nongrouping变量。

选项 描述 例子
变量名

一个特征向量或标量字符串指定单个表变量名

“Var1”

“Var1”

向量的变量名

特征向量的单元阵列或字符串数组,其中每个元素是一个表变量名

{“Var1”“Var2”}

[" Var1”“Var2”)

标量或矢量变量指标

一个标量或矢量表变量指标

1

[1 3 5]

逻辑向量

逻辑向量的每个元素对应一个表变量真正的包括相应的变量不包括它

(真的假的真的)

函数处理

一个函数处理,表变量作为输入,并返回一个逻辑标量

@isnumeric

vartype下标

表生成的下标vartype函数

vartype(数字)

当输入数据是一张桌子T你指定一个函数处理方法这需要多个输入参数,您必须指定datavars。的datavars参数必须是一个单元阵列的元素表中的任何选项。细胞数组元素指示表为每个输入变量的使用方法。在每次调用函数组,输入参数是细胞的数组元素对应的表变量。例如:

  • groupsummary (T groupvars @ (x, y) myFun (x, y), {“x1”、“日元”})计算myFun (T.x1 T.y1)为每个组。

  • groupsummary (T groupvars @ (x, y) myFun (x, y), {(“x1”“x2”)(“日元”“y2)})第一次计算myfun (T.x1 T.y1)对于每一个组,然后计算myfun (T.x2 T.y2)为每个组。

例子:groupsummary (T groupvars方法,(“Var1”“Var2”“Var4”])

装箱计划,指定为以下选项之一:

  • “没有”,表明没有装箱

  • 本边缘的列表,指定为一个数值向量,或datetime向量为datetime分组变量或向量

  • 一些垃圾箱,指定为一个整数标量

  • 时间,指定为一个标量类型持续时间calendarDuration表明本宽度(datetime持续时间分组变量或向量)

  • 时间本datetime持续时间指定分组变量或向量,如以下的其中一个特征向量:

    价值 描述 数据类型
    “第二”

    每本1秒。

    datetime持续时间
    “一分钟”

    每本1分钟。

    datetime持续时间
    “小时”

    每箱是1小时。

    datetime持续时间
    “天”

    每本1日历天。这个值占夏令时的转变。

    datetime持续时间
    “周” 每一本日历是1周。 datetime只有
    “月” 每本1日历月。 datetime只有
    “季” 每箱是1季度。 datetime只有
    “年”

    每本是1年。这个值占飞跃天。

    datetime持续时间
    “十年” 每本十年是1(10个日历年)。 datetime只有
    “世纪” 每本1世纪(100日历年)。 datetime只有
    “secondofminute”

    箱子从0到59秒。

    datetime只有
    “minuteofhour”

    箱子从0到59分钟。

    datetime只有
    “hourofday”

    箱子从0到23小时。

    datetime只有
    “dayofweek”

    箱子从1到7天。一周的第一天是星期天。

    datetime只有
    “dayname” 垃圾箱是一整天的名字等“星期天” datetime只有
    “dayofmonth” 箱子从1到31天。 datetime只有
    “dayofyear” 箱子从1到366天。 datetime只有
    “weekofmonth” 箱子从1到6周。 datetime只有
    “weekofyear” 箱子从1 - 54周。 datetime只有
    “monthname” 箱子里满是如月的名字“1月” datetime只有
    “monthofyear”

    箱子从1到12个月。

    datetime只有
    “quarterofyear” 箱子从1到4季度。 datetime只有

  • 单元阵列清单装箱规则为每个分组变量或向量

当多个指定分组变量,您可以提供一个装箱规则适用于所有分组变量,或一个细胞数组包含为每个分组变量,如装箱方法{“没有”,[0 2 4正]}

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:G = groupsummary (T groupvars groupbins,‘IncludedEdge’,‘正确的’)

包括本边缘,指定为“左”“对”,表明本间隔的包容性。

这个名称-值对只能时指定groupbins指定,值是适用于所有装箱计划为所有分组变量或向量。

失踪组指标,指定为真正的。当参数值真正的,groupsummary显示组织的缺失值,如。当参数值,groupsummary不显示缺失组。

数据类型:逻辑

空集团指标,指定为真正的。当参数值,groupsummary不显示组与零元素。当参数值真正的,groupsummary显示空的组。

数据类型:逻辑

输出参数

全部折叠

输出表,返回包含指定的计算为每个组表。

输出数组,返回包含组计算的向量或矩阵。当你指定多个方法,groupsummary横向连接计算的顺序列出。

组输入数据数组,返回为一个列向量或单元阵列的列向量对应一组向量。

当你提供多个分组向量,BG是一个单元阵列包含列向量的长度相等。组信息可以通过查看行中所有向量的元素BG。每一组映射到相应的行输出的数组B

集团统计数组输入数据,作为一个列向量返回包含元素在每组的数量。的长度公元前是一样的返回的列向量组的长度BG

提示

  • 打很多电话的时候出现groupsummary,可以考虑将分组变量转换为类型分类逻辑在可能的情况下提高性能。例如,如果你有一个分组类型的变量字符(如性别与元素“男”“女”),您可以使用命令转换成绝对价值分类(性别)

扩展功能

版本历史

介绍了R2018a

全部展开

行为改变R2022a