主要内容

groupcounts

组元素数量

描述

例子

G= groupcounts (TGroupvars.计算表或时间表中每组数据中的元素数量,并返回一个包含组、它们的计数和每个计数所代表的百分比(0到100)的表。每个组是由组变量的唯一组合定义的Groupvars..例如,g = groupcounts(t,'性别')返回显示数量的表男性元素的个数女性元素,以此类推变量中的任何其他类别性别

例子

G= groupcounts (TGroupvars.groupbins指定如何将数据装入Groupvars..例如,G = groupcounts (T,‘SaleDate’,‘年’)给出年度销售统计和百分比SaleDate

例子

G= groupcounts (___名称,值使用一个或多个名称 - 值对为任何前一个语法指定其他分组属性。例如,g = groupcounts(t,'category1','IncludeMissingGroups',false)不包括由missing组成的组分类数据指示<未定义>

B= groupcounts (一个返回包含在列向量,矩阵或列向量的小区阵列中表示的分组矢量的每个唯一组合的组计数的矢量一个

B= groupcounts (一个groupbins根据数据禁止数据groupbins

B= groupcounts (___名称,值使用一个或多个名称-值对指定其他分组属性。

例子

BBG英国石油公司] = groupcounts(一个___也返回组BG和百分比英国石油公司对应于计数B

例子

全部折叠

从表数据中计算组元素的数量。

创建一个包含五个人信息的表。

性别= [“男性”“女性”“男性”“女性”“男性”];吸烟者=逻辑([1,0,1,0,1]);重量= [176;163;131;133;119);T =表(性别、吸烟、体重)
t =5×3表性别吸烟者体重________ ______ ______“男”真176“女”假163“男”真131“女”假133“男”真119

按性别计算每组元素的数量。

G1 = groupcounts (T)“性别”
G1 =2×3表性别GroupCount百分比  ________ __________ _______ " 女性男性“2 40 3 60

根据性别和吸烟状况计算每一组中元素的数量。默认情况下,groupcounts抑制包含零元素的组,因此不为女性吸烟者或男性非吸烟者返回组。

g2 = groupcounts(t,{“性别”“抽烟”})
G2 =2×4表性别吸烟者GroupCount百分比  ________ ______ __________ _______ " 女性“假2 40“男性“真正3 60

要计算所有组,包括具有零元素的组,请指定“IncludeEmptyGroups”参数和值真的

G3 = groupcounts (T) {“性别”“抽烟”},“IncludeEmptyGroups”,真的)
G3 =4×4表性别吸烟者群体计数百分比________ ______ __________ _______“女”假2 40“女”真0 0“男”假0 0“男”真3 60

根据指定的垃圾箱进行组数据。

创建一个时间表,其中包含一个月内的销售信息。

时间戳= DateTime([2017 3 4; 2017 3 2; 2017 3 15; 2017 3 10;......2017年3 14;2017年3 31;2017年3 25;......2017 3 29;2017 3 21;2017 3 18]);利润= [2032 3071 1185 2587 1998 2899 3112 909 2619 3085]';TotalItemssold = [14 13 8 5 10 16 8 6 7 11]';TT =时间表(时间戳,利润,突然突出)
tt =10×2时间表时间戳利润TotalItemsSold ___________ ______ ______________ 04- march -2017 2032 14 02- march -2017 3071 13 15- march -2017 1185 8 10- march -2017 2587 5 14- march -2017 1998 10 31- march -2017 2899 16 25- march -2017 3112 8 29- march -2017 909 6 21- march -2017 2619 7 18- march -2017 3085 11

计算组计数通过销售的总项目,将组分为项目编号的间隔。

G = groupcounts (TT,“TotalItemsSold”,[0 4 8 12 16])
G =3×3表disc_TotalItemsSold GroupCount百分比  ___________________ __________ _______ [ 4, 8) 3 30[8、12)4 30 40(12、16)3

按星期的天数计算分组计数。

G = groupcounts (TT,“时间戳”“dayname”
G =5×3表dayname_TimeStamps GroupCount Percent __________________ _________________星期二2 20星期三2 20星期四1 10星期五2 20星期六3 30

确定向量中的哪些元素出现多次。

创建一个值在1到5之间的列向量。

V = [1 1 2 2 3 5 3 3 1 4]';

采用groupcounts确定向量中唯一的组并计算组成员。

[gc,grps] = groupcounts(v)
GC =5×13 2 3 1 1
毛评点=5×11 2 3 4 5 5

通过为计数大于1的组创建逻辑索引,确定向量中哪些元素出现了不止一次。在组中建立索引,以返回重复的向量元素。

副本= grps(gc > 1)
重复=3×11 2 3.

根据他们的性别和吸烟状况计算四组的数量。

将患者信息存储为三个不同类型的向量。

性别= [“男性”“女性”“男性”“女性”“男性”];吸烟者=逻辑([1,0,1,0,1]);重量= [176;163;131;133;119);

通过性别和吸烟者进行分组,计算组计数。指定三个输出也返回组BG和百分比英国石油公司.的B输出包含每个组的计数,和英国石油公司包含这些计数所代表的百分比。

[B,BG,BP] = Groupcounts({性别,吸烟者},“IncludeEmptyGroups”,真的)
B =4×12 0 0 3
BG =1×2单元阵列{4x1字符串} {4x1逻辑}
英国石油(BP) =4×140 0 0 60

BG是一个单元格数组,其中包含两个向量,在逐行查看组的元素时描述组。例如,的第一行BG {1}说,第一组的患者是女性,而第一排bg {2}说他们是非闻名者。该组的计数为2,在相应的行中找到B

BG {1}
ans =4 x1字符串"female" "female" "male" "male"
bg {2}
ans =4 x1逻辑阵列0 1 0 1

输入参数

全部折叠

输入数据,指定为表或时间表。

输入向量,指定为表示分组向量的列向量的列,矩阵或小区阵列。什么时候一个是一个矩阵,组向量是列的。

分组变量或向量,指定为该表中的选项之一。对于表格或时间表的输入数据,Groupvars.指示使用哪些变量来计算数据中的组。未指定的其他变量Groupvars.不操作,也不通过输出。

选项 描述 例子
变量的名称

指定单表变量名称的字符向量或标量标题

“Var1”

“var1”

变量名称矢量

字符向量或字符串数组的单元格数组,其中每个元素是表变量名

{“Var1”“Var2”}

[" Var1”“Var2”)

可变指标的标量或向量

表变量指数的标量或向量

1

[1 3 5]

逻辑矢量

逻辑向量,其元素每个元素对应于表变量,其中真的包含相应的变量和不包括它

(真的假的真的)

函数处理

接受表变量作为输入并返回逻辑标量的函数句柄

@isnumeric

vartype下标.

属性生成的表下标vartype功能

vartype(数字)

例子:Groupcounts(t,“var3”)

分融合计划,指定为以下选项之一:

  • “没有”,表示根据指定的分组变量返回组

  • BIN边缘列表,指定为数字分组变量的数字矢量或作为一个数字矢量约会时间向量约会时间分组变量

  • 许多箱子,指定为整数标量

  • 持续时间,指定为类型的标量持续时间要么calendarDuration,表示bin宽度(用于约会时间要么持续时间仅对变量或向量进行分组)

  • 列出每个分组变量或向量的分类规则的单元格数组

  • 一个时间垃圾箱约会时间持续时间只分组变量或向量,指定为以下字符向量之一:

    价值 描述 数据类型
    “第二”

    每个箱子是1秒。

    约会时间持续时间
    “一分钟”

    每个垃圾桶为1分钟。

    约会时间持续时间
    '小时'

    每个垃圾桶是1小时。

    约会时间持续时间
    “天”

    每个垃圾箱是1个日历天。这个值说明了夏令时转换。

    约会时间持续时间
    “周” 每个垃圾桶是一个日历周。 约会时间只有
    '月' 每个垃圾箱都是1个日历月。 约会时间只有
    '四分之一' 每个箱子是1个日历季度。 约会时间只有
    '年'

    每个垃圾桶是1个日历年。该值用于闰日。

    约会时间持续时间
    '十年' 每个垃圾桶是1个十年(10个日历年)。 约会时间只有
    “世纪” 每个垃圾箱都是1世纪(100个日历年)。 约会时间只有
    “secondofminute”

    箱子的时间从0到59秒。

    约会时间只有
    “minuteofhour”

    垃圾箱的分钟从0到59。

    约会时间只有
    'hourofday'

    箱子从0到23小时。

    约会时间只有
    “dayofweek”

    垃圾箱是从1天到7天。一周的第一天是星期天。

    约会时间只有
    “dayname” 垃圾箱是全天的名称,如'星期日' 约会时间只有
    “dayofmonth” 垃圾箱是1到31天。 约会时间只有
    “dayofyear” 垃圾桶是1到366天。 约会时间只有
    “weekofmonth” 垃圾箱从1到6周。 约会时间只有
    “weekofyear” 垃圾箱从1到54个星期。 约会时间只有
    'mountname' bin是完整的月份名称,例如'一月' 约会时间只有
    '铃声'

    垃圾箱是1到12个月。

    约会时间只有
    “quarterofyear” 垃圾箱是1到4的季度。 约会时间只有

当指定了多个分组变量或向量时,您可以提供应用于所有分组变量的单个分组规则,或包含每个分组变量的分组方法的单元数组,例如{'none',[0 2 4 Inf]}

名称值对参数

指定可选的逗号分隔的对名称,值参数。名称参数名和价值是相应的价值。名称必须出现在引号内。您可以以任何顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:g = groupcounts(t,groupvars,groupbins,'已加工指g','右')

包括仓边,指定为'剩下'要么“对”,指示bin间隔的哪个端点是包含的。

此名称值对只能指定何时groupbins,该值将应用于所有分组变量或向量的所有分类方案。

缺少组指示符,指定为数字或逻辑1真的)或0).如果参数值为真的,然后groupcounts显示由缺失值组成的组,例如.如果参数值为,然后groupcounts不显示缺失的值组。

空组指示符,指定为数字或逻辑0)或1真的).如果参数值为,然后groupcounts不显示元素为零的组。如果参数值为真的,然后groupcounts显示空组。

输出参数

全部折叠

输出表,作为包含计算组的表返回,每个组中的元素数,以及每个组计数表示的百分比。对于单个分组变量,输出组根据返回的顺序进行排序独特函数与'排序'选择。

非表输入数据的组计数,作为包含每个组中元素数量的列向量返回。

非表输入数据的组,作为列向量或列向量的小区阵列返回。对于单个分组向量,输出组根据返回的顺序排序独特函数与'排序'选择。

当你提供多个输入向量时,BG是包含等长列向量的单元格数组。组信息可以通过遍历所有向量的元素行来找到BG.每个组的计数包含在第一个输出参数的相应行中B

非表输入数据的组计数百分比,作为包含每个组计数的百分比的列向量返回B代表。百分比在范围内100年[0]

提示

  • 当打许多电话时groupcounts,考虑将分组变量转换为类型分类要么逻辑在可能的情况下提高性能。例如,如果您有一个类型为的分组变量字符(如性别与元素“男”“女”),您可以使用命令将其转换为分类变量分类(性别)

兼容性考虑因素

全部展开

R2021A中的行为发生了变化

扩展功能

介绍了R2019a