主要内容

填充

填补缺失值

描述

例子

F= fillmissing(一种,'不变',V.填充缺少数组或表的缺失条目,持续值V..如果一种是矩阵还是多维数组V.可以是标量也可以是向量。当V.是一个矢量,每个元素指定相应列中的填充值一种.如果一种是桌子还是时刻表V.也可以是单元格阵列。

缺少值根据数据类型定义一种

  • -期间, 和calendarDuration

  • -约会时间

  • <缺失>-字符串

  • <未定义>-分类

  • ' '-字符

  • {''}-细胞的字符数组

如果一种是一个表,然后每个列的数据类型定义该列缺少的值。

例子

F= fillmissing(一种方法使用指定的方法填充缺失的项方法.例如,Fillmissing(A,'之前')使用以前的非缺少条目填充缺失的条目一种

例子

F= fillmissing(一种movmethod.窗口使用移动窗口平均值或窗口长度的中值填充缺失的项窗口.例如,fillmissing(“movmean”,5)使用窗口长度为5的移动平均填充数据。

例子

F= fillmissing(___暗淡指定维度一种运作。默认,填充沿着尺寸不等于的第一维操作。例如,如果一种是一个矩阵,然后fillmissing (2)在列中运行一种,逐行填充缺失的数据。

例子

F= fillmissing(___名称,价值使用一个或多个名称-值对参数指定填补缺失值的附加参数。例如,如果T.那是时间值的矢量,然后填充(a,'线性','samplepoints',t)插入数据一种相对于时间T.

例子

[F特遣部队] =填充(___另外还返回对应于条目的逻辑阵列一种吃饱了。

例子

全部收缩

创建一个包含的向量值并替换每个以前的非缺失值。

a = [1 3 naN 4 nan nan 5];f = fillmissing(a,'以前的'
F =1×7.1 3 3 4 4 4 5

使用插值替换非均匀抽样数据中的值。

定义非均匀样本点的向量,并在点上评估正弦函数。

x = [-4 * pi:0.1:0,0.1:0.2:4 * pi];a = sin(x);

注入值到一种

a(<0.75&a> 0.5)= nan;

使用线性插值填充缺失的数据,并返回填充后的向量F而逻辑向量特遣部队.值1 (真的)参赛作品特遣部队对应于值F吃饱了。

(F, TF) = fillmissing (,'线性''samplepoints',X);

绘制原始数据和填充数据。

绘图(x,a,'。',x(tf),f(tf),'o')Xlabel('X');ylabel('sin(x)')传说(“原始数据”'充满了缺失的数据'

使用移动的中位数填充缺少的数字数据。

创建一个样本点矢量X和数据矢量一种其中包含缺失的值。

x = Linspace(0,10,200);a = sin(x)+ 0.5 *(rand(尺寸(x)) -  0.5);a([1:10 RANDI([1长度(x)],1,50)])= nan;

取代一种使用带有长度10窗口的移动中位数,并绘制原始数据和填充数据。

f = fillmissing(a,“movmedian”10);情节(x, F,' r . - ',x,a,'B.-')传说('充满了缺失的数据'“原始数据”

使用线性插值一次创建具有缺失条目的矩阵并填充列(第二维度)一行一行。对于每行,填充带有最接近的非缺失值的前导和尾随缺失值。

A =[南南5 3南5 7南9南;8 9南1 4 5南5南5;南4 9 8 7 2 4 1 1南]
A =3×10NaN NaN 5 3 NaN 5 7 NaN 9 NaN 8 9 NaN 1 4 5 NaN 5 NaN 5 NaN 4 9 8 7 2 4 1 1 NaN
f = fillmissing(a,'线性'2,'endvalues'“最近的”
F =3×105 5 5 3 4 5 7 8 9 9 8 9 5 1 4 5 5 5 5 5 4 4 9 8 7 2 4 1 1 1

使用不同的数据类型填充表变量的缺失值。

创建一个变量包括的表分类, 和字符数据类型。

a =表(分类({“阳光”;“多云”;''}),[66; nan; 54],{'';'n';'是'},[37; 39; nan],...“VariableNames”,{'描述''温度''雨''湿度'})
A =3×4表描述温度雨湿度  ___________ ___________ __________ ________ 阳光66 {0 x0 char} 37多云南{' N '} 39 <定义> 54 {Y} NaN

将所有缺失的条目替换为从上一个条目中的值。由于没有以前的元素变量,丢失的字符向量未被替换。

f = fillmissing(a,'以前的'
f =3×4表描述温度雨湿度___________ ___________ _________________________0x___0x_0 char} 37阴天66 {'n'} 39阴天54 {'y'} 39

更换来自的价值温度湿度变量in.一种用0。

f = fillmissing(a,“不变”0,'datavariables',{'温度''湿度'})
f =3×4表描述温度雨湿度___________ ___________ _____________________________0 char} 37阴天0 {'n'} 39 <未定义> 54 {'y'} 0

另外,使用isnumeric.函数识别数字变量进行操作。

f = fillmissing(a,“不变”0,'datavariables',@ isnumeric)
f =3×4表描述温度雨湿度___________ ___________ _____________________________0 char} 37阴天0 {'n'} 39 <未定义> 54 {'y'} 0

输入参数

全部收缩

输入数据,指定为向量,矩阵,多维数组,表或时间表。

如果一种是时间表,然后只填充表值。如果相关的行时间向量包含一个或者那么填充产生一个错误。行时间必须是唯一的,并且按升序排列。

数据类型:||INT8.|int16|int32|int64|uint8|uint16|uint32|UINT64|逻辑|字符|字符串|细胞|桌子|时间表|分类|约会时间|期间|calendarDuration

填充常量,指定为标量,向量或单元格数组。V.可以是矢量何时一种是矩阵或多维阵列。V.什么时候可以是单元格数组一种是一个表或时间表。

数据类型:||INT8.|int16|int32|int64|uint8|uint16|uint32|UINT64|逻辑|字符|细胞|分类|约会时间|期间

填充方法,指定为以下之一:

方法 描述
'以前的' 以前的非缺失值
“下一个” 下一个非缺失值
“最近的” 最近的non-missing价值
'线性' 相邻,非缺失值的线性插值(数字,期间, 和约会时间仅限数据类型)
样条的 分段立方样条插值(数字,期间, 和约会时间仅限数据类型)
'pchip' 形状保留分段立方样条插值(数字,期间, 和约会时间仅限数据类型)
“makima” 修改Akima立方Hermite插值(数字,期间, 和约会时间仅限数据类型)

填充缺失数据的移动方法,指定为以下之一:

方法 描述
“movmean” 在长度窗口上移动平均水平窗口(仅限数字数据类型)
“movmedian” 在一个长度窗口上移动中间值窗口(仅限数字数据类型)

窗口长度,指定为正整数标量,正整数的两个元素矢量,正持续时间标量或正持续时间的两个元素矢量。

窗口如果是一个正整数标量,则窗口围绕当前元素居中并包含窗口1相邻的元素。如果窗口甚至,窗口符合当前和以前的元素。如果窗口是正整数的二元向量吗[b f],然后窗口包含当前元素,B.元素向后,F元素。

一种是时间表还是'samplepoints'被指定为一个约会时间或者期间向量,窗口必须有类型期间, Windows是相对于样本点计算的。

数据类型:||INT8.|int16|int32|int64|uint8|uint16|uint32|UINT64|期间

维度运行,指定为正整数标量。如果没有指定值,则默认值是第一个数组维度,其大小不等于1。

一种是一个表或时间表,暗淡不受支持。万博1manbetx填充沿每个表或时间可变分别操作。

考虑一个二维输入数组,一种

  • 如果昏暗的= 1, 然后填充填满一种列的列。

  • 如果昏暗的= 2, 然后填充填满一种行按行。

数据类型:||INT8.|int16|int32|int64|uint8|uint16|uint32|UINT64

名称值对参数

指定可选的逗号分离对名称,价值参数。的名字是参数名称和价值是相应的价值。的名字必须出现在引号内。您可以以任何顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:fillmissing (A, DataVariables,{“温度”、“高度”})属性对应的列温度高度输入表的变量

处理端点的方法,指定为逗号分隔的配对组成'endvalues'一之一'extrap''以前的'“下一个”“最近的”'没有任何',或恒定的标量值。端点填充方法根据以下定义处理引导和尾随缺失值:

方法 描述
'extrap' 和...一样方法
'以前的' 以前的非缺失值
“下一个” 下一个非缺失值
“最近的” 最近的non-missing价值
'没有任何' 没有填充值
标量子 恒定值(数值,期间, 和约会时间仅限数据类型)

数据类型:||INT8.|int16|int32|int64|uint8|uint16|uint32|UINT64|逻辑|约会时间|期间

填充方法的采样点,指定为逗号分隔的对组成'samplepoints'和矢量。采样点代表数据的位置一种,并且必须排序并包含唯一的元素。采样点不需要均匀采样。如果一种是时间表,然后默认采样点向量是行时间的向量。否则,默认向量是[1 2 3…]

移动窗口相对于采样点定义。例如,如果T.是与输入数据相对应的时间的矢量fillmissing(兰德(1 10)“movmean”,3,SamplePoints, t)有一个代表之间的时间间隔的窗口T(i)-1.5T(i)+1.5

当样本点向量具有数据类型时约会时间或者期间,然后移动窗口长度必须具有类型期间

当输入数据是时间表时,不支持该名称值对。万博1manbetx

数据类型:||约会时间|期间

表变量填充,指定为逗号分隔对组成'datavariables'和变量名,变量名称的单元阵列,数字矢量,逻辑向量,函数句柄或表格vartype.下标。这'datavariables'值表示要填充的输入表的哪一列,并且可以是以下之一:

  • 指定单表变量名称的字符矢量

  • 字符向量的单元格数组,其中每个元素是一个表变量名

  • 表可变指数的矢量

  • 逻辑向量,其元素每个元素对应于表变量,其中真的包括相应的变量和错误的不包括它

  • 返回逻辑标量的函数句柄,例如@isnumeric

  • 一张桌子vartype.下标

例子:'年龄'

例子:{'身高体重'}

例子:@ iscategorical.

例子:vartype('numeric')

已知的缺失指示符,指定为逗号分隔对组成'遗漏'逻辑向量,矩阵,或相同大小的多维数组一种.指标元素可以是真的在对应位置指示缺失的值一种或者错误的除此以外。

数据类型:逻辑

要填充的最大间隙大小,指定为数字标量,期间标量,或者calendarDuration标量。间隙是连续缺失值的群集,其大小是围绕间隙围绕的非缺失值之间的距离。间隙大小以相对于采样点以单位计算。填充小于或等于最大间隙尺寸的间隙,并且比间隙尺寸大的间隙不是。

例如,考虑向量Y = [25南纳100]使用默认采样点[1 2 3 4].向量中的间隙大小由采样点计算为4 - 1 = 3,所以A.maxgap.的价值2保留缺失的值不改变,而maxgap.的价值3.填写缺失的值。

对于数据开头或结尾缺少的值:

  • 输入数据末尾的单个缺失值具有0的间隙大小,始终填充。

  • 在输入数据的开头或结尾处发生的缺失值的集群不完全由非缺失值包围,因此使用最近的现有样本点计算间隙大小。对于默认采样点1: N,这产生的间隙大小比在数据中间发生的相同群集时比相同的间隙大小。

输出参数

全部收缩

填充数据,作为向量,矩阵,多维数组,表或时间表返回。F是同号的吗一种

数据类型:||INT8.|int16|int32|int64|uint8|uint16|uint32|UINT64|逻辑|字符|字符串|细胞|桌子|时间表|分类|约会时间|期间|calendarDuration

填充数据指示符,返回为向量,矩阵或多维数组。特遣部队是一个逻辑阵列,其中1(真的)对应于参赛作用F填满了0(错误的)对应于不变的条目。特遣部队是同号的吗一种F

数据类型:逻辑

扩展功能

介绍在R2016B.