excludedata

排除来自拟合数据

描述

TF= excludedata(Xÿ,'框',返回一个逻辑阵列,其指示哪些元素是在外面所指定的xy平面上的框。的元素TF为外箱,0为盒内的数据点的数据点等于1。要使用曲线拟合时排除数据适合,指定TF作为'排除'值。

TF= excludedata(Xÿ,'域',有标识的数据点X在区间外 - 值

TF= excludedata(Xÿ,'范围',范围识别数据点与ÿ在区间外 - 值范围

TF= excludedata(Xÿ'指数',指数识别数据点具有索引等于指数

例子

全部收缩

采用可视化的随机数据排除规则。

随机生成Xÿ数据。

XDATA = -3 + 6 *兰特(1,1e4);YDATA = -3 + 6 *兰特(1,1e4);

作为一个例子,排除要么是箱内数据[-1 1 -1 1]或外域[-2 2]

outliers1 =〜excludedata(XDATA,YDATA,'框',[ -  1 1 -1 1]);outliers2 = excludedata(XDATA,YDATA,'域',[ -  2 2]);离群值= outliers1 | outliers2;

剧情未排除的数据。白色区域对应于被排除的区域。

图(扩展数据(〜异常值),YDATA(〜异常值),'')轴([ -  3 3 -3 3])轴广场

加载投票计数,县名佛罗里达州从2000美国总统大选的状态。

加载flvote2k

使用的两个主要政党的候选人,布什和戈尔的选票数,作为预测的第三党候选人布坎南的投票数,并绘制散射:

图(灌木,布坎南,'RS')保持图(血腥,布坎南,“博”)图例(“布什数据”“戈尔数据”

假设一个模型,其中布什或戈尔的选民的固定比例选择投给布坎南。

F = fittype({'X'})
F =线性模型:F(A,X)= A * X

从缺席投票的选民,谁没有使用争议的“蝴蝶”的选票排除的数据。

nobutterfly =的strcmp(县,“缺席选票”);

执行bisquare权稳健拟合模型的两个数据集,但不包括缺席投票的选民。

bushfit =拟合(衬套,布坎南,F,'排除',nobutterfly,'强大的''上');gorefit =拟合(戈尔,布坎南,F,'排除',nobutterfly,'强大的''上');

强大的拟合给离群低重量,因此从稳健的拟合残差大,可以用来识别异常值。

图图(bushfit,灌木,布坎南,'RS'“残差”)保持图(gorefit,血腥,布坎南,“博”“残差”

计算残差。

bushres =布坎南 -  feval(bushfit,衬套);goreres =布坎南 -  feval(gorefit,戈尔);

识别大残差那些范围[-500 500]外面。

bushoutliers = excludedata(衬套,bushres,'范围',[ -  500 500]);goreoutliers = excludedata(戈尔,goreres,'范围',[ -  500 500]);

显示对应于离群值的县。迈阿密 - 戴德和布劳沃德县对应最大预测值。棕榈滩县,在该州唯一的县使用“蝴蝶”的投票中,对应于最大的剩余价值。

各县(bushoutliers)
ANS =2×1单元{“迈阿密 - 戴德”} {“棕榈滩”}
各县(goreoutliers)
ANS =3X1细胞{“布劳沃德”} {“迈阿密 - 戴德”} {“棕榈滩”}

输入参数

全部收缩

数据值的数据点,指定为数值向量。

数据值,指定为数值向量。

框查找数据外,指定为数字矢量[XMIN XMAX YMIN YMAX]其中包含四个要素。

例:[-1 1 0 2]

域找到的数据外,指定为数值向量[XMIN XMAX]有两个元素。

例:[-1 1]

域找到的数据外,指定为数值向量[YMIN YMAX]有两个元素。

例:[3 4]

数据点的指数发现,指定为数字载体。

例:[3 7 9]

也可以看看

|

R2006a前推出