滤波和平滑的数据
关于数据平滑和滤波
您可以使用光滑的
函数平滑的响应数据。您可以使用可选的移动平均线方法,Savitzky-Golay过滤器,和当地的回归和没有重量和健壮性(洛斯
,黄土
,rlowess
和rloess
)。
移动平均滤波
移动平均滤波器平滑数据通过替换每个数据点与相邻数据点的平均值中定义。这个过程相当于低通滤波与平滑的响应由差分方程给出
在哪里y<年代ub>年代年代ub>(我)的平滑值我
数据点,N两侧是相邻数据点的数量y<年代ub>年代年代ub>(我),2N+ 1是跨度。
所使用的移动平均滤波法曲线拟合工具箱™遵循这些规则:
张成的空间必须是奇数。
平滑的数据点必须的中心。
数据点的调整跨度不能适应指定数量的邻居。
终点不平滑,因为跨度不能定义。
注意,您可以使用过滤器
函数来实现差分方程,如上面所示的一个。然而,由于结束点的方式治疗,工具箱移动平均结果将不同于返回的结果过滤器
。指差分方程和过滤为更多的信息。
例如,假设您使用移动平均滤波器平滑数据跨度的5。使用上面描述的规则,第一个四元素y
年代年代ub>是由
y<年代ub>年代年代ub>(1)= (1)y<年代ub>年代年代ub>(2)= (y (1) + (2) + y (3) / 3 y<年代ub>年代年代ub>(3)= (y y y (1) + (2) + (3) + (4) + y (5)) / 5 y<年代ub>年代年代ub>(4)= (y y (2) + (3) + (4) + y (5) + y (6)) / 5
请注意,y
年代年代ub>(1)
,y
年代年代ub>(2)
,……,y
年代年代ub>(结束)
引用的顺序排序后的数据,并不是原始订单。
平滑值和跨越的前四个数据点生成数据集如下所示。
情节(一)
表明,第一个数据点并不平滑,因为跨度不能建造。情节(b)
表明,第二个数据点是使用的三平滑。情节(c)
和(d)
表明的5是用来计算平滑值。
Savitzky-Golay过滤
Savitzky-Golay过滤可以看作是一个通用的移动平均线。你获得通过执行一个未加权的线性最小二乘滤波器系数符合使用给定的多项式。出于这个原因,Savitzky-Golay滤波器也称为数字平滑多项式滤波器或最小二乘平滑滤波器。注意到一个更高的多项式可以达到一个高水平的数据平滑无衰减特性。
Savitzky-Golay过滤的方法通常是使用频率数据或光谱(峰值)数据。对于频率数据,该方法有效地保留信号的高频分量。对于光谱数据,该方法有效地保持更高的高峰时刻,如线宽。相比之下,移动平均滤波器会过滤掉很大一部分信号的高频内容,它只能保持较低的峰值的时刻,如质心。然而,Savitzky-Golay过滤可以那么成功比移动平均滤波器拒绝噪音。
Savitzky-Golay平滑方法使用曲线拟合工具箱软件遵循这些规则:
张成的空间必须是奇数。
多项式程度必须小于跨度。
数据点不需要有统一的间距。
通常,Savitzky-Golay过滤要求均匀间隔的预测数据。然而,曲线拟合工具箱算法支持非均匀间距。万博1manbetx因此,您不需要执行额外的过滤步骤来创建数据和统一的间距。
如下所示的图显示生成的高斯数据和一些尝试使用Savitzky-Golay平滑方法。数据非常嘈杂,峰值宽度不同广泛的缩小。跨度等于5%的数据点的数量。
情节(一)
显示了嘈杂的数据。更容易地比较平滑的结果,情节(b)
和(c)
显示数据,同时不会增加噪音。
情节(b)
显示的结果与一个二次多项式平滑。注意,方法执行不佳的狭窄的山峰。情节(c)
显示的结果与四次多项式平滑。一般来说,高阶多项式可以更准确地捕捉窄峰的高度和宽度,但能做的差平滑更广泛的山峰。
当地回归平滑
洛斯和黄土
名称“洛斯”和“黄土”一词源于“局部加权散点图平滑,”这两种方法使用局部加权线性回归平滑数据。
平滑的过程被认为是当地的,因为像移动平均法,每个平滑值是由相邻数据点内定义的。这个过程是加权因为回归加权函数的定义中包含的数据点。除了回归加权函数,您可以使用一个健壮的权函数,使得这个过程对离群值。最后,使用的方法是有区别的模型回归:洛斯使用一个线性多项式,而黄土使用一个二次多项式。
当地回归平滑方法使用曲线拟合工具箱软件遵循以下规则:
张成的空间可以是奇数还是偶数。
您可以指定张成的空间数据点的总数的百分比的数据集。例如,跨度为0.1使用10%的数据点。
当地的回归方法
当地的回归为每个数据点平滑过程遵循这些步骤:
如果顺利计算包含相同数量的相邻数据点两侧的平滑数据点,权重函数是对称的。然而,如果相邻点的数量是不对称的平滑的数据点,然后加权函数是不对称的。注意,与移动平均线的平滑过程,从不改变。例如,当您顺利的数据点最小的预测价值,权函数的形状由半截断,最左边的数据点在拥有最大的重量,和所有的相邻点右边的平滑值。
终点的权函数和一个内点如下所示的31个数据点。
使用洛斯方法的跨度5、平滑值和相关回归的前四个数据点生成数据集如下所示。
注意,不改变跨度的平滑过程进展从数据点数据点。然而,根据最近的邻居的数量,回归加权函数可能不对称的数据点是平滑的。特别是,情节(一)
和(b)
使用一个不对称的权函数,而情节(c)
和(d)
使用对称的权函数。
对于黄土方法,图表会看起来一样,除了平滑值生成一个二次多项式。
强大的本地回归
如果你的数据包含异常值,平滑值可以变得扭曲,不能反映的行为大部分相邻数据点。为了克服这个问题,你可以平滑的数据使用一个健壮的过程不受异常值的一小部分。对异常值的描述,请参考残留分析。
曲线拟合工具箱软件提供一个健壮的版本为洛斯和黄土平滑方法。这些健壮的方法包括额外计算的权重,这是对离群值。健壮的平滑过程遵循这些步骤:
计算的残差平滑过程在前一节中描述。
计算<年代pan class="emphasis">健壮的权重为每个数据点。bisquare赋予的权重函数,
在哪里r<年代ub>我年代ub>剩余的吗我th回归平滑过程,产生的数据点疯了的平均绝对偏差残差,
平均绝对偏差是如何分散的测量残差。如果r<年代ub>我年代ub>小于6疯了,那么健壮的重量接近1。如果r<年代ub>我年代ub>大于6疯了的体重是0和相关的数据点是排除在光滑的计算。
平滑的数据再次使用健壮的权重。最后使用本地回归平滑值计算重量和健壮的重量。
重复前两个步骤总共五个迭代。
洛斯过程的平滑结果比较下面的结果健壮的洛斯程序生成的数据集,其中包含一个异常值。跨越的过程是11数据点。
情节(一)
显示异常值影响的平滑值几个最近的邻居。情节(b)
表明,残余的离群值大于6平均绝对偏差。因此,健壮的重量为这个数据点是零。情节(c)
表明,相邻的平滑值异常反映的大部分数据。
例如:平滑数据
加载数据count.dat
:
负载count.dat
24-by-3数组数
包含在三个十字路口交通计数每小时的一天。
首先,使用移动平均滤波器和一个5小时的跨度一次顺利的所有数据(通过线性索引):
c =光滑(count (:));C1 =重塑(c, 24岁,3);
情节的原始数据和平滑数据:
次要情节(1,1)情节(统计,“:”);抓住情节(C1,“-”);标题(“光滑的C1(所有数据)”)
第二,使用相同的滤波器来平滑每一列的数据分别:
C2 = 0(24日3);我= 1:3,C2(:,我)=光滑(count (:, I));结束
再次,画出原始数据和平滑数据:
次要情节(3,1,2)情节(统计,“:”);抓住情节(C2,“-”);标题(“光滑的C2(每一列)”)
情节的区别两个平滑数据集:
次要情节(3、1,3)情节(C2 - C1,“啊——”)标题(“区别C2 - C1”)
注意额外的影响从三栏光滑。
例如:用黄土和健壮的黄土平滑数据
创建的数据异常值:
x = 15 *兰德(150 1);y = sin (x) + 0.5 *(兰德(-0.5尺寸(x)));y(装天花板(长度(x) *兰特(2,1)))= 3;
使用平滑数据黄土
和rloess
方法的10%:
yy1 =光滑(x, y, 0.1,“黄土”);yy2 =光滑(x, y, 0.1,“rloess”);
原始数据和平滑数据。
[xx,印第安纳州]= (x)进行排序;次要情节(2,1,1)情节(xx, y(印第安纳州),b。, xx, yy1(印第安纳州),r -)组(gca、“YLim”,[-1.5 - 3.5])传说(“原始数据”,使用“黄土”平滑数据,…“位置”、“西北”)次要情节(2,1,2)情节(xx, y(印第安纳州),b。, xx, yy2(印第安纳州),r -)组(gca、“YLim”,[-1.5 - 3.5])传说(“原始数据”,“使用”rloess平滑数据”,…“位置”、“西北”)
注意,离群值没有影响的方法。