主要内容

histcounts

直方图箱数

描述

例子

N边缘) = histcounts (X分区的X值放入容器,并返回每个容器中的计数以及容器边。的histcounts函数使用自动分类算法返回具有统一宽度的容器,选择该宽度的容器覆盖元素的范围X并揭示其分布的基本形状。

例子

N边缘) = histcounts (Xnbins使用标量指定的容器数量,nbins

例子

N边缘) = histcounts (X边缘排序X进入箱子,箱子边由向量指定,边缘.的值X(我)是在kth本如果边(k)X(我)<边(k + 1).最后一个仓还包括右仓边,以便它包含X(我)如果边(end-1)X(我)边(结束)

例子

N边缘箱子) = histcounts (___也返回一个索引数组,箱子,使用任何前面的语法。箱子数组的大小是否相同X哪些元素是对应元素的bin索引X.元素的数量kth本是nnz(本= = k),也就是N (k)

例子

N= histcounts (C,在那里C是一个类别数组,返回一个向量,N,表示中元素的数量C谁的值等于每一个C的类别。N每个类别有一个元素在C

N= histcounts (C类别只计算其中的元素C哪个值等于由类别

例子

N类别) = histcounts (___还返回与中的每个计数对应的类别N对类别数组使用前面的任何一种语法。

例子

___) = histcounts (___名称,值使用一个或多个指定的附加选项名称,值使用前面语法中的任何输入或输出参数组合对参数进行配对。例如,可以指定“BinWidth”以及用于调整数值数据的容器宽度的标量。对于分类数据,您可以指定“归一化”,要么“数”“countdensity”“概率”“pdf”“cumcount”,或“提供”

例子

全部折叠

将100个随机值分配到容器中。histcounts自动选择适当的仓宽以显示数据的底层分布。

X = randn (100 1);[N,边缘]= histcounts (X)
N =1×72 17 28 32 16 32
边缘=1×83 -2 -1 0 1 2 3 4

将10个数字分配到6个等间距的箱子中。

X = [2 3 5 7 11 13 17 19 23 29];[N,边缘]= histcounts (X, 6)
N =1×62 2 2 1 1
边缘=1×70 4.9000 9.8000 14.7000 19.6000 24.5000 29.4000

将1000个随机数字分配到容器中。用vector定义bin边,其中第一个元素是第一个箱子的左边,最后一个元素是最后一个箱子的右边。

X = randn (1000 1);Edges = [-5 -4 -1 -0.5 0 0.5 1 2 4 5];N = histcounts (X,边缘)
N =1×100 24 149 142 195 200 154 111 25 0

把所有小于100的质数分配到箱子里。指定“归一化”作为“概率”将容器计数标准化,以便总和(N)1.也就是说,每个箱子计数表示一个观察到的物品落入该箱子的概率。

X =质数(100);[N,边缘]= histcounts (X,“归一化”“概率”
N =1×40.4000 0.2800 0.2800 0.0400
边缘=1×50 30 60 90 120

在-5和5之间分配100个随机整数到bins,并指定“BinMethod”作为“整数”使用以整数为中心的单位宽度容器。指定第三个输出histcounts返回表示数据的bin索引的向量。

X =兰迪([5 5],100,1);[N,边缘,本]= histcounts (X,“BinMethod”“整数”);

通过计算数字的出现次数,找到第三个箱子的箱子数3.在bin索引向量中,箱子.结果是一样的N (3)

数= nnz(本= = 3)
数= 8

创建一个表示投票的绝对向量。向量中的类别是“是的”“不”,或“决定”

A = [0 0 1 1 0 0 0 0 NaN 1 0 0 0 1 0 0 0 1 0 0 0 1 1 1];C = categorical(A,[10 0 NaN],{“是的”“不”“决定”})
C =1 x27分类列1到9不是的是的是的不不不不列10到16决定决定是的不不不列17到25没有是的是的不不不是的是的列26日至27日是的是的

确定每个类别中元素的数量。

[N,类别]= histcounts (C)
N =1×311 14 2
类别=1 x3单元格{'是的'}{‘不’}{“犹豫不决”}

输入参数

全部折叠

分布在容器中的数据,指定为向量、矩阵或多维数组。如果X不是向量吗histcounts把它看成一个单列向量,X (:)

histcounts忽略所有值。同样的,histcounts忽略了值,除非容器边明确指定作为仓边。

数据类型:||int8|int16|int32|int64|uint8|uint16|uint32|uint64|逻辑|datetime|持续时间

分类数据,指定为分类数组。histcounts忽略未定义的分类值。

数据类型:分类

箱的数量,指定为正整数。如果没有指定nbins,然后histcounts根据里面的值自动计算要使用多少个箱子X

例子:[N,边缘]= histcounts (X, 15)使用15箱。

Bin边,指定为向量。边(1)是第一个箱子的左边缘,和边(结束)是最后一个箱子的右边。

对于datetime和duration数据,边缘必须是按单调递增顺序排列的日期时间或持续时间向量。

数据类型:||int8|int16|int32|int64|uint8|uint16|uint32|uint64|逻辑|datetime|持续时间

包含在计数中的类别,指定为字符向量的单元向量或分类向量。默认情况下,histcounts为类别数组中的每个类别使用容器C.使用类别来指定类别的唯一子集。

例子:h = histcounts (C,{“大”、“小”})只计算类别中的类别数据“大”“小”

数据类型:细胞|分类

名称-值对的观点

指定可选的逗号分隔的对名称,值参数。的名字参数名和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:[N,边缘]= histcounts (X,“正常化”,“概率”)使垃圾箱计数正常N,这样总和(N)是1。

Bin极限,指定为二元向量,[bmin, bmax].这个选项只收纳其中的值X之间,bminbmax包容;也就是说,X (X > = bmin & < = bmax)

此选项不适用于分类数据。

例子:[N,边缘]= histcounts (X,“BinLimits”,[1,10])只回收箱中的值X之间的是110包容性。

bining算法,指定为该表中的一个值。

价值

描述

“汽车”

默认的“汽车”算法选择一个仓宽来覆盖数据范围,并揭示底层分布的形状。

“斯科特。”

如果数据接近正态分布,Scott规则是最优的,但也适用于大多数其他分布。它的箱宽为3.5 *性病(X(:)) *元素个数(X) ^ (1/3)

“fd”

Freedman-Diaconis规则对数据中的异常值不太敏感,可能更适合于重尾分布的数据。它的箱宽为2 *差(X(:)) *元素个数(X) ^ (1/3),在那里位差的四分位范围是X

“整数”

整数规则对于整数数据很有用,因为它为每个整数创建一个bin。它使用的仓宽为1,并将仓边放在整数中间。为了防止意外创建过多的容器,限制65536个容器(216)可以使用该规则创建。如果数据范围大于65536,则使用更宽的容器。

请注意

“整数”不支持dateti万博1manbetxme或duration数据。

斯特奇斯的

斯特奇斯的规则是一个简单的规则,因为它的简单而受欢迎。它选择箱子的数量装天花板(1 + log2(元素个数(X)))

“√”

平方根规则是另一个在其他软件包中广泛使用的简单规则。它选择箱子的数量装天花板(√元素个数(X)))

histcounts并不总是使用这些精确的公式来选择箱子的数量。有时会稍微调整桶的数量,使桶的边缘落在“好的”数字上。

对于datetime数据,bin方法可以是以下时间单位之一:

“第二” “月”
“一分钟” “季”
“小时” “年”
“天” “十年”
“周” “世纪”

对于持续时间数据,bin方法可以是以下时间单位之一:

“第二” “天”
“一分钟” “年”
“小时”

如果您指定BinMethod然后使用datetime或duration数据histcounts可以使用最多65,536个垃圾桶(或216).如果指定的容器持续时间需要更多的容器,则histcounts使用与最大箱数相对应的较大箱宽。

此选项不适用于分类数据。

例子:[N,边缘]= histcounts (X,“BinMethod”,“整数”)使用整数为中心的容器。

容器的宽度,指定为标量。如果您指定BinWidth,然后histcounts可以使用最多65,536个垃圾桶(或216).如果指定的仓宽需要更多的仓,则histcounts使用与最大箱数相对应的较大箱宽。

对于datetime和duration数据,取值为“BinWidth”可以是标量持续时间或日历持续时间。

此选项不适用于分类数据。

例子:[N,边缘]= histcounts (X, BinWidth, 5)使用宽度为5的箱子。

规格化的类型,指定为该表中的一个值。对于每一个本

  • v 为bin值。

  • c 是容器中元素的数量。

  • w 是容器的宽度。

  • N 是输入数据中元素的数量。如果数据包含,该值可以大于被装箱的数据NaT,或<定义>值,或者如果某些数据位于容器限制之外。

价值 本值 笔记
“数”(默认)

v c

  • 计数或观察的频率。

  • 箱值之和小于或等于元素个数(X).总和小于元素个数(X)仅当一些输入数据没有包含在容器中时。

  • 对于分类数据,bin值的和为元素个数(X)sum (ismember (X(:),类别))

“countdensity”

v c w

  • 计数或频率按料仓宽度缩放。

  • 对于分类数据,这与“数”

请注意

“countdensity”不支持dateti万博1manbetxme或duration数据。

“cumcount”

v j 1 c j

  • 累计计数。每个箱子的值是该箱子和之前所有箱子中观察到的累计数量。

  • 最后一个容器的值小于或等于元素个数(X)

  • 对于分类数据,最后一个箱子的值小于或等于元素个数(X)sum (ismember (X(:),类别))

“概率”

v c N

  • 相对概率。

  • 箱值之和小于或等于1

“pdf”

v c N w

  • 概率密度函数估计。

  • 对于分类数据,这与“概率”

请注意

“pdf”不支持dateti万博1manbetxme或duration数据。

“提供”

v j 1 c j N

  • 累积密度函数估计。

  • N(结束)是小于还是等于1

例子:[N,边缘]= histcounts (X,“正常化”,“pdf”)用概率密度函数估计装箱数据。

输出参数

全部折叠

Bin计数,作为行向量返回。

Bin边,作为向量返回。边(1)是第一个箱子的左边缘,和边(结束)是最后一个箱子的右边。

Bin索引,作为大小相同的数组返回X.中的每个元素箱子描述在哪个编号的容器中包含相应的元素X

的值0箱子指示不属于任何容器的元素(例如,a值)。

包含在计数中的类别,作为字符向量的单元格向量返回。类别包含C与每一个计数相对应N

提示

  • 的行为histcounts是类似的离散化函数。使用histcounts查找每个容器中元素的数量。另一方面,使用离散化查找每个元素属于哪个箱子(不计算)。

扩展功能

介绍了R2014b