主要内容

histcounts

直方图箱数

描述

例子

(N,边缘)= histcounts (X)分区的X值放入垃圾箱,并返回计数在每个垃圾桶,垃圾桶边。的histcounts函数使用一个自动装箱算法返回垃圾箱与统一的宽度,选择封面元素的范围X并揭示底层的形状分布。

例子

(N,边缘)= histcounts (X,nbins)使用指定的垃圾箱标量的数量,nbins

例子

(N,边缘)= histcounts (X,边缘)排序X与本垃圾箱边指定的向量,边缘。的值X(我)是在kth本如果边(k)X(我)<边(k + 1)。最后本还包括正确的垃圾箱边,所以它包含X(我)如果边(end-1)X(我)边(结束)

例子

(N,边缘,)= histcounts (___)返回索引数组,,使用任何先前的语法。是一个数组的大小一样吗X的元素是本指数中相应的元素X。元素的数量kth本是nnz(本= = k),这是一样的N (k)

例子

N= histcounts (C),在那里C是一个分类数组,返回一个向量,N表示元素的数量C其值等于每个C的类别。N有一个元素为每个类别C

N= histcounts (C,类别)数量只有元素C其值等于指定的类别的子集类别

例子

(N,类别)= histcounts (___)返回类别,对应于每个计数N使用以前的语法分类数组。

例子

(___)= histcounts (___,名称,值)使用指定的一个或多个额外的选项名称,值对参数使用任何输入或输出参数组合在以前的语法。例如,您可以指定“BinWidth”和一个标量数值数据调整箱子的宽度。分类数据,您可以指定“归一化”,要么“数”,“countdensity”,“概率”,“pdf”,“cumcount”,或“提供”

例子

全部折叠

分发100随机值放入垃圾箱。histcounts自动选择一个合适的宽度揭示底层数据的分布。

X = randn (100 1);[N,边缘]= histcounts (X)
N =1×72 17 28 32 16 3 2
边缘=1×83 2 1 0 1 2 3 4

分配10数字6等距的垃圾箱。

X =[2 3 5 7 11 13日17日19日23日29);[N,边缘]= histcounts (X, 6)
N =1×62 2 2 2 1 1
边缘=1×70 4.9000 9.8000 14.7000 19.6000 24.5000 - 29.4000

分发1000随机数进入垃圾箱。定义本边缘一个向量,其中第一个元素是左边缘的第一本,和最后一个元素的右边缘是最后一本。

X = randn (1000 1);边缘= [5 4 2 1 0 0.5 -0.5 1 2 4 5];N = histcounts (X,边缘)
N =1×1024 149 142 195 200 154 111 0 0。25

分发所有的质数少于100进垃圾箱。指定“归一化”作为“概率”规范化,箱子数量总和(N)1。也就是说,每一本数表示属于的观察意见,这使得本的概率。

X =质数(100);[N,边缘]= histcounts (X,“归一化”,“概率”)
N =1×40.4000 0.2800 0.2800 0.0400
边缘=1×530 60 90 120 0

5和5之间分发100个随机整数进垃圾箱,并指定“BinMethod”作为“整数”使用宽箱集中在整数。指定一个第三输出histcounts返回一个向量代表本指标的数据。

X =兰迪([5 5],100,1);[N,边缘,本]= histcounts (X,“BinMethod”,“整数”);

找到一本数第三本通过计算数量的事件3本指数向量,。结果是一样的N (3)

数= nnz(本= = 3)
数= 8

创建一个分类向量代表的选票。向量的分类“是的”,“不”,或“决定”

一个=[0 0 1 1 1 0 0 0 0南南1 0 0 0 1 0 1 0 1 0 0 0 1 1 1 1];C =分类([1 0南],{“是的”,“不”,“决定”})
C =1 x27分类列1到9不是的是的是的不不不不列10到16决定决定是的不不不列17到25没有是的是的不不不是的是的列26日至27日是的是的

确定元素落入每个类别的数量。

[N,类别]= histcounts (C)
N =1×311 14 2
类别=1 x3单元格{'是的'}{‘不’}{“犹豫不决”}

输入参数

全部折叠

数据分发在垃圾箱中,指定为一个向量,矩阵,或多维数组。如果X不是一个向量,那么histcounts把它当作一个列向量,X (:)

histcounts忽略所有值。同样的,histcounts忽略了除非本边缘显式地指定值作为一个本边缘。

数据类型:||int8|int16|int32|int64|uint8|uint16|uint32|uint64|逻辑|datetime|持续时间

分类数据,指定为一个分类数组。histcounts忽略了未定义的分类值。

数据类型:分类

箱子数量,指定为一个正整数。如果你不指定nbins,然后histcounts自动计算有多少箱子使用基于中的值X

例子:[N,边缘]= histcounts (X, 15)使用15箱。

本边缘,指定为一个向量。边(1)是第一本的左边缘,边(结束)的右边缘是最后一本。

对于日期时间和持续时间数据,边缘必须是一个datetime或持续时间向量单调递增的顺序。

数据类型:||int8|int16|int32|int64|uint8|uint16|uint32|uint64|逻辑|datetime|持续时间

类别包括在统计,指定为字符串向量,细胞特征向量的向量,模式标量或分类向量。默认情况下,histcounts为每个类别分类数组中使用一个本C。使用类别指定一个独特的类别的子集。

例子:h = histcounts (C,(“大”、“小”))只计算分类数据的类别

例子:h = histcounts (C,“Y”+ wildcardPattern)统计分类数据在所有类别的名字从这封信开始Y

数据类型:字符串|细胞|模式|分类

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:[N,边缘]= histcounts (X,“正常化”,“概率”)可实现本数量N,这样总和(N)是1。

本限制,指定为一个双元素向量,[bmin, bmax]。此选项只垃圾箱中的值X之间,bminbmax包容;也就是说,X (X > = bmin & < = bmax)

这个选项不适用于分类数据。

例子:[N,边缘]= histcounts (X,“BinLimits”, [1, 10])垃圾箱中的值X之间的是110包容性。

装箱算法,在这个表指定为一个值。

价值

描述

“汽车”

默认的“汽车”算法选择本宽度的数据范围,揭示潜在分布的形状。

“斯科特。”

斯科特的规则是最优的,如果数据是接近正态分布,但也适合大多数其他发行版。它使用一个本的宽度3.5 *性病(X(:)) *元素个数(X) ^ (1/3)

“fd”

Freedman-Diaconis规则对数据中离群值不敏感,可能更适合数据和重尾分布。它使用一个本的宽度2 *差(X(:)) *元素个数(X) ^ (1/3),在那里位差四分位范围的X

“整数”

整数与整数数据规则是有用的,因为它创造了一个本为每一个整数。它使用一个本的宽度1和地方本边缘介于整数。防止意外地创建太多的垃圾箱,限制65536箱(216这条规则可以创建)。如果数据范围大于65536,那么使用广泛的垃圾箱。

请注意

“整数”不支持dateti万博1manbetxme或持续时间数据。

斯特奇斯的

斯特奇斯的规则是一个简单的规则,很受欢迎,因为它很简单。它选择的箱子数量装天花板(1 + log2(元素个数(X)))

“√”

平方根的规则是另一个简单的规则广泛应用于其他软件包。它选择的箱子数量装天花板(√元素个数(X)))

histcounts并不总是选择使用这些箱子的数量准确的公式。有时垃圾箱的数量略有调整,这样本边落在“好”的数字。

datetime数据,本方法可以其中一个单位的时间:

“第二” “月”
“一分钟” “季”
“小时” “年”
“天” “十年”
“周” “世纪”

对于持续时间数据,本方法可以其中一个单位的时间:

“第二” “天”
“一分钟” “年”
“小时”

如果您指定BinMethoddatetime或持续时间数据histcounts最多可以使用65536箱(或216)。如果指定的本需要更多的垃圾箱,持续时间histcounts使用一个大本宽度对应于容器的最大数量。

这个选项不适用于分类数据。

例子:[N,边缘]= histcounts (X,“BinMethod”,“整数”)使用垃圾箱集中在整数。

箱子的宽度,指定为一个标量。如果您指定BinWidth,然后histcounts最多可以使用65536箱(或216)。如果指定的宽度需要更多的垃圾箱,然后histcounts使用一个大本宽度对应于容器的最大数量。

日期时间和持续时间数据的价值“BinWidth”可以是一个标量时间或日历时间。

这个选项不适用于分类数据。

例子:[N,边缘]= histcounts (X, BinWidth, 5)使用箱子的宽度5。

箱子边缘,指定为一个数值向量。第一个向量元素指定第一本的左边缘。最后一个元素指定了最后一本的右边缘。如果你不指定垃圾桶边,然后histcounts自动确定本边缘的位置。

这个选项不适用于分类数据。

数据类型:||int8|int16|int32|int64|uint8|uint16|uint32|uint64|逻辑

类型的正常化,指定为这个表中的值之一。对于每一个本:

  • v 是一本价值。

  • c 本是元素的数量。

  • w 箱子的宽度。

  • N 在输入数据元素的数量。这个值可以大于分箱数据,如果数据包含,NaT,或<定义>值,或者一些数据在本限制之外。

价值 本值 笔记
“数”(默认)

v = c

  • 数或频率的观察。

  • 本值之和小于或等于元素个数(X)。之和小于元素个数(X)只有当一些输入数据不包括在垃圾桶中。

  • 分类数据,本值的总和元素个数(X)sum (ismember (X(:),类别))

“countdensity”

v = c w

  • 数和频率宽度比例的垃圾箱。

  • 对分类数据,这一样“数”

请注意

“countdensity”不支持dateti万博1manbetxme或持续时间数据。

“cumcount”

v = j = 1 c j

  • 累计计数。每本值的累积数量的观察,本和所有之前的箱子。

  • 最后一本的价值小于或等于元素个数(X)

  • 分类数据,最后一本的价值小于或等于元素个数(X)sum (ismember (X(:),类别))

“概率”

v = c N

  • 相对概率。

  • 本值之和小于或等于1

“pdf”

v = c N w

  • 概率密度函数估计。

  • 对分类数据,这是一样的“概率”

请注意

“pdf”不支持dateti万博1manbetxme或持续时间数据。

“提供”

v = j = 1 c j N

  • 累计密度函数估计。

  • N(结束)小于或等于什么1

例子:[N,边缘]= histcounts (X,“正常化”,“pdf”)箱子使用概率密度函数估计的数据。

箱子数量,指定为一个正整数。如果你不指定NumBins,然后histcounts自动计算有多少箱子使用基于输入数据。

这个选项不适用于分类数据。

输出参数

全部折叠

箱数,返回一个行向量。

本边缘,作为一个向量返回。边(1)是第一本的左边缘,边(结束)的右边缘是最后一本。

本指标,作为一个数组返回相同的大小X。中的每个元素描述了它本编号包含相应的元素X

的值0表示一个元素不属于任何箱(例如,一个值)。

类别包括在统计,作为细胞返回特征向量的向量。类别包含的类别C对应于每一个计数N

提示

  • 的行为histcounts类似的吗离散化函数。使用histcounts找到元素的数量在每一个垃圾箱。另一方面,使用离散化找本每个元素所属(不计数)。

扩展功能

版本历史

介绍了R2014b