mainvarsetnorm

对基因表达值从两个实验条件或表型执行秩不变集归一化

折叠所有页面

语法

NormDataY= mainvarsetnorm (数据X，DATAY) NormDataY= mainvarsetnorm(…“阈值”,ThresholdsValue,……) NormDataY= mainvarsetnorm(…“排除”,ExcludeValue,……) NormDataY= mainvarsetnorm（...， '百分'，PercentileValue,……) NormDataY= mainvarsetnorm（...， '迭代'，IterateValue,……) NormDataY= mainvarsetnorm（...， '法'，MethodValue,……) NormDataY= mainvarsetnorm（...， '跨度'，SpanValue,……) NormDataY= mainvarsetnorm（...， 'Showplot'，ShowplotValue,……)

参数

`DataX`	基因表达值的载体从单一的实验条件或表型，其中每一行对应一个基因。这些数据点作为基准。
`DataY`	基因表达值的载体从单一的实验条件或表型，其中每一行对应一个基因。这些数据点将使用基线标准化。
`ThresholdsValue`	为两个数据集之间的最低平均秩和最高平均秩设置阈值的向量。每个数据点的平均秩是通过先将值转换为`DataX`和`DataY`到队伍中，进行平均，两个级别的每个数据点。然后，对于每个数据点的阈值是由针对最低平均等级阈值和用于最高平均等级阈值之间进行内插来确定。请注意这些单独的阈值用来确定秩不变集，这是一组数据点，每个数据点的秩差(prd)都小于其预先设定的阈值。有关秩不变集的更多信息，请参见描述。 `ThresholdsValue`是一个1×2矢量[`LT，HT`]，其中`LT`是最低的平均等级门槛，`H T`对于平均最高等级门坎。选择这两个阈值凭经验来限制不变集的蔓延，但允许足够的数据点来确定正常化关系。值必须介于`0`和`1`。默认为[`0.03, 0.07`]。
`ExcludeValue`	属性过滤不变组数据点，通过排除数据点的平均等级（间`DataX`和`DataY`）是最高的`N`排名平均或最低`N`排名的平均值。
`PercentileValue`	物业停止迭代过程，当数据点在不变集河段数`N`输入数据点总数的百分比。默认是`1`。请注意如果不使用此属性，迭代过程将继续，直到没有更多的数据点被消除。
`IterateValue`	属性来控制用于确定不变集数据点的迭代过程。输入`真正`重复此过程，直至没有更多的数据点被消除，或已确定数据点的百分比(`PercentileValue`)。输入`假`仅执行一个过程的迭代。默认是`真正`。提示选择`假`对于较小的数据集，通常小于200个数据点。
`MethodValue`	属性来选择用于标准化数据平滑方法。输入`“洛斯”`要么`'runmedian'`。默认是`“洛斯”`。
`SpanValue`	属性设置为平滑方法中的窗口大小。如果`SpanValue`小于1，窗口大小是数据点的数量的该百分比。如果`SpanValue`等于或大于1时，窗口的大小是多少`SpanValue`。默认是`0.05`，其窗口大小等于不变集中数据点总数的5%。
`ShowplotValue`	属性来控制对M-A散点图的标绘（前和归一化之后）。M是之间的比率`DataX`和`DataY`。A是的平均值`DataX`和`DataY`。输入`真正`来创建一对M-A散点图。默认是`假`。

描述

NormDataY= mainvarsetnorm (数据X，DATAY)归一化值DataY，一个基因表达值载体，到一个参考载体，DataX使用不变集方法。NormDataY一个标准化的基因表达值载体来自哪里DataY。

特别，mainvarsetnorm:

确定比例秩差(珠江三角洲)每一对职级，RankX和RANKY从基因表达值的两个向量，DataX和DataY。

珠江三角洲= ABS（RankX-RANKY)
通过选取秩差成比例的数据点(珠江三角洲）低于阈，它是给定数据点(由ThresholdsValue属性)。它选择性地重复这个过程，直到没有更多的数据点被消除，或者达到预定的数据点的百分比。

不变集为具有a的数据点珠江三角洲<阈。
利用数据点的不变集来计算低值或运行中值平滑曲线，该曲线用于对中值进行归一化DataY。

请注意

如果DataX要么DataY包含NaN值，那么NormDataY也将包含在相应的位置NaN值。

提示

mainvarsetnorm是用于双色微阵列数据校正染料偏置是有用的。

NormDataY= mainvarsetnorm(…”,PropertyName”,PropertyValue,……)调用mainvarsetnorm部分可选的属性是使用属性名称/属性值对。您可以按任意顺序指定一个或多个属性。每PropertyName必须用单引号括起来，不区分大小写。这些属性名称/属性值对如下:

NormDataY= mainvarsetnorm(…“阈值”,ThresholdsValue,……)设置两个数据集之间的最低平均秩和最高平均秩的阈值。每个数据点的平均秩是通过先将值转换为DataX和DataY到队伍中，进行平均，两个级别的每个数据点。然后，对于每个数据点的阈值是由针对最低平均等级阈值和用于最高平均等级阈值之间进行内插来确定。

请注意

这些单独的阈值用来确定秩不变集，这是一组数据点，每个数据点的秩差(prd)都小于其预先设定的阈值。有关秩不变集的更多信息，请参见描述。

ThresholdsValue是一个1×2矢量[LT，HT]，其中LT是最低的平均等级门槛，H T对于平均最高等级门坎。选择这两个阈值凭经验来限制不变集的蔓延，但允许足够的数据点来确定正常化关系。值必须介于0和1。默认为[0.03, 0.07]。

NormDataY= mainvarsetnorm(…“排除”,ExcludeValue,……)过滤不变的数据点集合，通过排除的数据点的平均等级（间DataX和DataY）是最高的N排名平均或最低N排名的平均值。

NormDataY= mainvarsetnorm（...， '百分'，PercentileValue,……)当不变集中的数据点数达到时，停止迭代过程N输入数据点总数的百分比。默认是1。

请注意

如果不使用此属性，迭代过程将继续，直到没有更多的数据点被消除。

NormDataY= mainvarsetnorm（...， '迭代'，IterateValue,……)控制用于确定不变集的数据点的迭代过程。当IterateValue是真正,mainvarsetnorm重复该过程，直到没有更多的数据点被消除，或数据点的预定百分比（PercentileValue)。当IterateValue是假，只执行流程的一次迭代。默认是真正。

提示

选择假对于较小的数据集，通常小于200个数据点。

NormDataY= mainvarsetnorm（...， '法'，MethodValue,……)选择平滑方法对数据进行归一化。当MethodValue是“洛斯”,mainvarsetnorm使用lowess方法。当MethodValue是'runmedian',mainvarsetnorm使用运行中位数法。默认是“洛斯”。

NormDataY= mainvarsetnorm（...， '跨度'，SpanValue,……)将针对平滑方法的窗口大小。如果SpanValue小于1，窗口大小是数据点的数量的该百分比。如果SpanValue等于或大于1时，窗口的大小是多少SpanValue。默认是0.05，其窗口大小等于不变集中数据点总数的5%。

NormDataY= mainvarsetnorm（...， 'Showplot'，ShowplotValue,……)确定是否绘制对M-A散点图（前和归一化之后）。M是之间的比率DataX和DataY。A是的平均值DataX和DataY。当ShowplotValue是真正,mainvarsetnorm绘制M-A散点图。默认是假。

例子

全部收缩

规范化芯片数据

开立真实脚本

该实施例说明如何校正用于从双色微阵列实验数据的两个信道之间的染料偏压或扫描的差异。

从样品GPR文件中读取微阵列数据。

maStruct = gprread（“mouse_a1wt.gpr”）;

从两个不同的实验条件下提取的基因表达值。

cy5data = magetfield（maStruct，“F635中位数”）;cy3data = magetfield（maStruct，“F532值”）;

正常化cy3data使用cy5data作为参考并绘制结果。

Normcy3data = mainvarsetnorm（cy5data，cy3data，“showplot”,真正的);

在理想的实验条件下，表达值相等的数据点沿M = 0线下降，表示基因表达率为1。然而，染色偏置导致一个通道的测量值高于另一个通道，如归一化前的图所示。标准化纠正了方差，如后归一化图所示。

参考

曾国忠，吴敏kyu，罗林，廖，廖锦昌，王文辉(2001)发表于cDNA微阵列分析:品质过滤、通道归一化、变异模型与基因效应评估。核酸的研究。29，2549年至2557年。

[2]霍夫曼，R.，塞德尔，T。，和杜格斯，M。（2002）上的检测寡核苷酸的微阵列数据分析的差异表达基因正常化深刻的影响。基因组生物学。3（7）：研究0033.1-0033.11。

另请参阅

affyinvarsetnorm|malowess|manorm|quantilenorm

介绍了R2006a

生物信息学工具箱文档

万博1manbetx

尝试MATLAB、Sim万博1manbetxulink和其他产品s manbetx 845

现在就试用