主要内容

正常化

规范化的数据

描述

例子

N=正常化(一个)返回vectorwisez分数中数据的一个与中心0和标准偏差1。

  • 如果一个是一个矢量,然后呢正常化作用于整个向量一个

  • 如果一个是一个矩阵,然后呢正常化作用于每一列的一个分开。

  • 如果一个是一个多维数组,那么正常化的第一个维度一个的大小不等于1。

  • 如果一个是一个表,或时间表,然后呢正常化对每个变量进行操作一个分开。

例子

N=正常化(一个,昏暗的)指定的尺寸一个操作。例如,正常化(2)使每一行规范化。

例子

N=正常化(___,方法)指定一个归一化法与任何以前的语法。例如,正常化(A,“规范”)规范化的数据在一个欧几里得范数(2-norm)。

例子

N=正常化(___,方法,methodtype)指定的类型为给定的方法标准化。例如,正常化(“规范”,正无穷)规范化的数据在一个使用无穷范数。

N=正常化(___“中心”,centertype“规模”,scaletype)使用“中心”“规模”在同一时间的方法。这是唯一的方法可以用在一起。如果你不指定centertypescaletype,然后正常使用默认方法类型的方法(定心的意思是0和扩展的标准偏差)。

使用这个语法与任何类型执行中心和规模两种方法。例如,N =正常化(A,“中心”,“中等”,“规模”,“疯狂”)。您还可以使用该语法来指定值中心和规模C年代从以前计算归一化。例如,一个数据集正常化并保存参数(N1, C, S) =正常化(A1)。然后,再利用这些参数在不同的数据集N2 =正常化(A2,“中心”,C,“规模”,年代)

例子

N=正常化(___,名称,值)为平滑使用一个或多个指定额外的参数名称参数。例如,正常化(A ' DataVariables datavars)可实现指定的变量datavars一个是一个表或时间表。

例子

(N,C,年代)=正常化(___)此外返回定心和缩放值C年代用于执行正常化。然后,您可以正常使用中的值不同的输入数据C年代N =正常化(A2,“中心”,C,“规模”,年代)

例子

全部折叠

规范化数据向量和矩阵计算z分数。

创建一个向量v和计算z分数,规范数据的意思是0和标准偏差1。

v = 1:5;N =正常化(v)
N =1×50.6325 - 1.2649 -1.2649 - -0.6325 0

创建一个矩阵B并计算每一列的z分数。然后,每一行正常化。

B =魔法(3)
B =3×38 1 6 3 5 7 4 9 2
N1 =正常化(B)
N1 =3×30 0.7559 -0.3780 1.0000 -0.7559 1.1339 -1.0000 0.3780 -1.1339
N2 =正常化(B, 2)
N2 =3×30 1.0000 -0.2774 1.1094 -1.0000 0.8321 -1.1094 0.2774 -0.8321

规模一个向量一个由它的标准差。

一个= 1:5;Ns =正常化(,“规模”)
Ns =1×50.6325 1.2649 1.8974 2.5298 3.1623

规模一个所以它的范围是在区间[0,1]。

Nr =正常化(,“范围”)
Nr =1×50 0.2500 0.5000 0.7500 1.0000

创建一个向量一个由其1-norm和规范化。

一个= 1:5;Np =正常化(,“规范”,1)
Np =1×50.0667 0.1333 0.2000 0.2667 0.3333

中心的数据一个所以,它的意思是0。

数控=正常化(,“中心”,“的意思是”)
数控=1×52 1 0 1 2

创建一个表包含五人的高度信息。

LastName = {“桑切斯”;“约翰逊”;“李”;“Diaz”;“棕色”};身高= [71;69;64;67;64);T =表(LastName、高度)
T =5×2表LastName高度_____ _____桑切斯71年约翰逊69年李64年“Diaz”67“棕色”64

最大高度规范化的高度数据。

N =正常化(T)“规范”正,“DataVariables”,“高度”)
N =5×2表LastName高度____ ____“桑切斯”1“约翰逊”0.97183“李”0.90141“Diaz”0.94366“棕色”0.90141

规范化数据集,还计算出的参数值,参数和重用应用相同的归一化到另一个数据集。

与两个变量创建一个时间表:温度风速。然后创建第二个时间表相同的变量,但是一年后样本。

rng默认的Time1 = (datetime(2019、1、1):天(1):datetime (10) 2019 1) ';温度=兰迪(40 [10]10 1);= randi风速(20 [0]10 1);T1 =时间表(温度、风速、“RowTimes”Time1)
T1 =10×2时间表时间温度风速___________ ___________ _____ 35 3 02 - 01 - 1月- 2019年1月- 2019年38个20 03 - 2019年1月- 2019年1月13 20 04 - - 38 10 05 - 2019年1月- 2019年1月16日06 - 29日- 13 2 07 - 2019年1月- 2019年1月18日8 08 - - 26日19日09 - 1月- 2019年39 16 10 - 20 2019年1月- 39
Time2 = (datetime(2020、1、1):天(1):datetime (10) 2020 1) ';温度=兰迪(40 [10]10 1);= randi风速(20 [0]10 1);T2 =时间表(温度、风速、“RowTimes”Time2)
T2 =10×2时间表时间温度风速___________ ___________ _____ 01 - 1月- 2020年30 14 02 - 1月- 2020年11 0 36 5 04 - 03 - 1月- 2020年1月- 2020年38个0 05 - 2020年1月- 2020年1月31日2 06 - - 33 17 07 33 14 - 1月- 2020年08 - 2020年1月- 2020年1月22日6 09 - - 30 10 - 1月19日- 2020年15 0

正常化的第一个时间表。指定三个输出:归一化表,以及定心和尺度参数值C年代这个函数使用执行规范化。

[T1_norm C S] =正常化(T1)
T1_norm =10×2时间表时间温度风速___________ ___________ _____ 01 - 1月- 2019 0.57687 -1.4636 02 - 1月- 2019年0.856 - 0.92885 03 - 1月- 2019年04—05 jan - 2019 0.856 -0.4785 0.92885 -1.4701 0.018609 - 0.36591 - 1月- 2019年06 - 1月- 2019年07年-1.4701 - -1.6044 -1.0049 - -0.75997 - 1月- 2019年08 - 1月- 2019年-0.26052 - 0.78812 09 - 2019年1月- 2019年1月0.94905 - 0.36591 10 - - 0.94905 - 0.92885
C =1×2表温度风速……_____ 28.8 - 13.4
S =1×2表温度风速……_____ 10.748 - 7.1056

现在第二个正常化的时间表T2从第一个规范化使用参数值。这种技术确保了数据T2集中和缩放以同样的方式吗T1

T2_norm =正常化(T2,“中心”C“规模”,年代)
T2_norm =10×2时间表时间温度风速___________ ___________ _____ 01 - 1月- 2020 0.11165 0.084441 02 - 1月- 2020年-1.6562 - -1.8858 03 - 1月- 2020年04—05 jan - 2020 0.856 -1.8858 -1.1822 0.66992 0.2047 - -1.6044 - 1月- 2020年06 - 1月- 2020年07年0.39078 - 0.50665 0.39078 - 0.084441 - 1月- 2020年08 - 1月- 2020年-0.6327 - -1.0414 09 - 2020年1月- 2020年1月0.11165 - 0.78812 10 - - -1.284 - -1.8858

默认情况下,正常化作用于任何变量T2也存在于C年代。规范化的变量的一个子集T2,指定变量的操作DataVariables名称-值参数。您所指定的变量子集必须存在C年代

指定风速作为数据变量来操作。正常化作用于该变量并返回温度不变。

T2_partial =正常化(T2,“中心”C“规模”年代,“DataVariables”,“风速”)
T2_partial =10×2时间表时间温度风速___________ ___________ _____ 30 0.084441 02 - 01 - 1月- 2020年1月- 2020年11 -1.8858 36 -1.1822 04 - 03 - 1月- 2020年1月- 2020年38 -1.8858 05 - 2020年1月- 2020年1月31日-1.6044 06 - - 33 33 0.084441 0.50665 07 - 1月- 2020年08 - 2020年1月- 2020年1月22日-1.0414 09 - - 30 0.78812 10 - 1月- 2020年15 -1.8858

输入参数

全部折叠

输入数据,指定为一个标量、向量矩阵,多维数组,表,或时间表。

如果一个是一个数值数组和类型,然后输出也有类型。否则,输出类型

正常化忽略了一个

数据类型:|||时间表
复数的支持:万博1manbetx是的

操作维度,指定为一个正整数标量。如果没有指定值,默认的是第一个数组维度的大小不等于1。

对于输入的数据表或时间表,昏暗的不支持和操作变万博1manbetx量分别在每个表或时间表。

归一化法,指定为这些选项之一:

方法

描述

“zscore”

z分数意思是0和标准偏差1。

“规范”

2-norm。

“规模”

规模的标准差。

“范围”

重新调节[0,1]的数据范围。

“中心”

数据中心的意思是0。

“medianiqr”

数据中心和规模0和中位数四分位范围1。

返回参数的函数使用规范化数据,指定C年代输出参数。

方法类型,指定为一个数组,表,双元素行向量,或类型名称,根据指定的方法:

方法

方法类型选项

描述

“zscore”

“性病”(默认)

中心和规模意味着0和标准偏差1。

“稳健”

值0,中心和规模平均绝对偏差1。

“规范”

积极的数字标量(默认是2)

p规范。

无穷范数。

“规模”

“性病”(默认)

规模的标准差。

“疯了”

规模的平均绝对偏差

“第一”

规模数据的第一个元素。

“差”

规模的四分位范围

数字数组

规模的数值。必须有一个数组兼容的大小与输入一个

表中使用变量。每个表变量的输入数据一个扩展使用名称类似变量中的值换算表。

“范围”

2-element行向量[0 1](默认)

重新调节范围的数据表单的一个区间[b],在那里< b

“中心”

“的意思是”(默认)

中心意思是0。

“中值”

中心值0。

数字数组

转移中心数值。必须有一个数组兼容的大小与输入一个

转移中心表中使用变量。每个表变量的输入数据一个集中使用名称类似变量中的值在定心表中。

返回参数的函数使用规范化数据,指定C年代输出参数。

中心和规模方法类型,指定为任何有效methodtype选择“中心”“规模”方法,分别。看到methodtype参数描述的可用选项列表的方法。

例子:N =正常化(A,“中心”,C,“规模”,年代)

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:正常化(T ' ReplaceValues假)

表变量操作,指定为这个表的选项之一。的DataVariables值表示该变量的输入表来填补。

没有指定表中的其他变量DataVariables通过输出没有规范化。

选项 描述 例子
变量名

一个特征向量或标量字符串指定单个表变量名

“Var1”

“Var1”

向量的变量名

特征向量的单元阵列或字符串数组,其中每个元素是一个表变量名

{“Var1”“Var2”}

[" Var1”“Var2”)

标量或矢量变量指标

一个标量或矢量表变量指标

1

[1 3 5]

逻辑向量

逻辑向量的每个元素对应一个表变量真正的包括相应的变量不包括它

(真的假的真的)

函数处理

一个函数处理,表变量作为输入,并返回一个逻辑标量

@isnumeric

vartype下标

表生成的下标vartype函数

vartype(数字)

例子:正常化(T“DataVariables”[“Var1”“Var2”“Var4”])

替换值指标,当指定为一个值一个是一个表或时间表:

  • 真正的1——输入表变量替换表包含标准化数据的变量。

  • 0——附加包含规范化数据输入表变量与表变量。

为向量、矩阵或多维数组输入数据,ReplaceValues不支持。万博1manbetx

例子:正常化(T ' ReplaceValues假)

输出参数

全部折叠

归一化值,作为一个数组,返回表,或时间表。

N一样的尺寸吗一个除非的价值ReplaceValues。如果该值的ReplaceValues,然后的宽度N是输入数据的总和变量指定宽度和数量的数据。

正常化通常作用于所有变量的输入表和时间表,除了在这些情况下:

  • 如果您指定DataVariables,然后正常化只作用于指定的变量。

  • 如果你使用语法正常化(T,“中心”,C,“规模”,年代)规范化一个表或时间表T使用前面计算参数C年代,然后正常化自动使用的变量名C年代确定变量的数据T操作。

定心的价值观,作为一个数组返回或表。

一个是一个数组,正常化返回C年代作为数组,N = (- C) / S。每个值在C是定心沿着指定的值用于执行规范化维度。例如,如果一个是一个10 *矩阵的数据和正常化运营的第一个维度C是一个1-by-10向量包含每一列的定心值一个

一个是一个表或时间表,正常化返回C年代为表包含每个表变量的中心和尺度归一化,N。Var = (。Var - C.Var)。/ S.Var。表变量的名字C年代在输入匹配对应的表变量。每个变量在C包含了定心值用于规范化类似命名变量一个

缩放值,作为一个数组返回或表。

一个是一个数组,正常化返回C年代作为数组,N = (- C) / S。每个值在年代是沿着指定的缩放值用于执行规范化维度。例如,如果一个是一个10 *矩阵的数据和正常化运营的第一个维度年代是一个1-by-10向量包含每一列的缩放值一个

一个是一个表或时间表,正常化返回C年代为表包含每个表变量的中心和尺度归一化,N。Var = (。Var - C.Var)。/ S.Var。表变量的名字C年代在输入匹配对应的表变量。每个变量在年代包含缩放值用于规范化类似命名变量一个

更多关于

全部折叠

Z分数

z分数衡量一个数据点的距离的平均值的标准偏差。标准化的数据集是0和标准偏差1,和保留形状属性的原始数据集(相同的偏态和峰态)。

为一个随机变量X意味着μ和标准差σ,z分数的值x z = ( x μ ) σ 对样本数据的意思 X ¯ 和标准偏差年代,z数据点的分数x z = ( x X ¯ ) 年代

P规范

的一般定义p规范的一个向量vN元素

v p = ( k = 1 N | v k | p ] 1 / p ,

在哪里p是任何积极的真正价值,,或。一些常见的值p是1、2和

  • 如果p是1,那么结果1-norm向量元素的绝对值的总和。

  • 如果p是2,那么结果2-norm给出了向量大小或欧几里得矢量的长度。

  • 如果p,然后 v = 马克斯 ( | v ( ) | )

重新调节

重新调节变化值的最大值和最小值之间的距离在一个数据集通过拉伸或挤压数轴上的点。的z分数的数据保存,所以分布的形状是相同的。

的方程重新调节数据X任意区间[b]

X r e 年代 c 一个 l e d = 一个 + ( X 最小值 X 马克斯 X 最小值 X ] ( b 一个 )

正常化重新调节函数可以重新调节数据任意间隔,重新调节还允许剪裁最大和最小值指定的输入数据。

四分位范围

四分位范围(差)的一个数据集描述范围的中间值的50%时,值排序。如果数据的中位数第二季的中值较低的数据的一半第一季度和中值数据的上半部分第三季,然后 差=第三季- Q1

差通常是优先于观察数据的全面数据包含异常值时(极大或极小值),因为差不包括最大的25%和25%的最小值数据。

平均绝对偏差

平均绝对偏差(疯狂)的一组数据的中位数是绝对偏离中值 X ˜ 的数据: 疯了 = 中位数 ( | x X ˜ | ) 。因此,疯狂描述数据的可变性与中值。

疯了一般优于使用标准差的数据时,数据包含异常值(极大或极小值),因为广场偏离均值,标准差为离群值过于巨大的影响。相反,少量的离群值的偏差不影响价值的疯了。

扩展功能

版本历史

介绍了R2018a

全部展开

另请参阅

功能

住编辑任务

应用程序