对基因表达值从两个实验条件或表型执行秩不变集归一化
NormDataY
= mainvarsetnorm (数据X,DATAY
)NormDataY
= mainvarsetnorm(…“阈值”,ThresholdsValue
,……)NormDataY
= mainvarsetnorm(…“排除”,ExcludeValue
,……)NormDataY
= mainvarsetnorm(..., '百分',PercentileValue
,……)NormDataY
= mainvarsetnorm(..., '迭代',IterateValue
,……)NormDataY
= mainvarsetnorm(..., '法',MethodValue
,……)NormDataY
= mainvarsetnorm(..., '跨度',SpanValue
,……)NormDataY
= mainvarsetnorm(..., 'Showplot',ShowplotValue
,……)
DataX |
基因表达值的载体从单一的实验条件或表型,其中每一行对应一个基因。这些数据点作为基准。 |
DataY |
基因表达值的载体从单一的实验条件或表型,其中每一行对应一个基因。这些数据点将使用基线标准化。 |
ThresholdsValue |
为两个数据集之间的最低平均秩和最高平均秩设置阈值的向量。每个数据点的平均秩是通过先将值转换为 请注意这些单独的阈值用来确定秩不变集,这是一组数据点,每个数据点的秩差(prd)都小于其预先设定的阈值。有关秩不变集的更多信息,请参见描述。
|
ExcludeValue |
属性过滤不变组数据点,通过排除数据点的平均等级(间 |
PercentileValue |
物业停止迭代过程,当数据点在不变集河段数 请注意如果不使用此属性,迭代过程将继续,直到没有更多的数据点被消除。 |
IterateValue |
属性来控制用于确定不变集数据点的迭代过程。输入 提示选择 |
MethodValue |
属性来选择用于标准化数据平滑方法。输入 |
SpanValue |
属性设置为平滑方法中的窗口大小。如果 |
ShowplotValue |
属性来控制对M-A散点图的标绘(前和归一化之后)。M是之间的比率 |
归一化值NormDataY
= mainvarsetnorm (数据X,DATAY
)DataY
,一个基因表达值载体,到一个参考载体,DataX
使用不变集方法。NormDataY
一个标准化的基因表达值载体来自哪里DataY
。
特别,mainvarsetnorm
:
确定比例秩差(珠江三角洲)每一对职级,RankX和RANKY从基因表达值的两个向量,DataX
和DataY
。
珠江三角洲= ABS(RankX-RANKY)
通过选取秩差成比例的数据点(珠江三角洲)低于阈,它是给定数据点(由ThresholdsValue
属性)。它选择性地重复这个过程,直到没有更多的数据点被消除,或者达到预定的数据点的百分比。
不变集为具有a的数据点珠江三角洲<阈。
利用数据点的不变集来计算低值或运行中值平滑曲线,该曲线用于对中值进行归一化DataY
。
如果DataX
要么DataY
包含NaN值,那么NormDataY
也将包含在相应的位置NaN值。
mainvarsetnorm
是用于双色微阵列数据校正染料偏置是有用的。
调用NormDataY
= mainvarsetnorm(…”,PropertyName
”,PropertyValue
,……)mainvarsetnorm
部分可选的属性是使用属性名称/属性值对。您可以按任意顺序指定一个或多个属性。每PropertyName
必须用单引号括起来,不区分大小写。这些属性名称/属性值对如下:
设置两个数据集之间的最低平均秩和最高平均秩的阈值。每个数据点的平均秩是通过先将值转换为NormDataY
= mainvarsetnorm(…“阈值”,ThresholdsValue
,……)DataX
和DataY
到队伍中,进行平均,两个级别的每个数据点。然后,对于每个数据点的阈值是由针对最低平均等级阈值和用于最高平均等级阈值之间进行内插来确定。
这些单独的阈值用来确定秩不变集,这是一组数据点,每个数据点的秩差(prd)都小于其预先设定的阈值。有关秩不变集的更多信息,请参见描述。
ThresholdsValue
是一个1×2矢量[LT,HT
],其中LT
是最低的平均等级门槛,H T
对于平均最高等级门坎。选择这两个阈值凭经验来限制不变集的蔓延,但允许足够的数据点来确定正常化关系。值必须介于0
和1
。默认为[0.03, 0.07
]。
过滤不变的数据点集合,通过排除的数据点的平均等级(间NormDataY
= mainvarsetnorm(…“排除”,ExcludeValue
,……)DataX
和DataY
)是最高的N
排名平均或最低N
排名的平均值。
当不变集中的数据点数达到时,停止迭代过程NormDataY
= mainvarsetnorm(..., '百分',PercentileValue
,……)N
输入数据点总数的百分比。默认是1
。
如果不使用此属性,迭代过程将继续,直到没有更多的数据点被消除。
控制用于确定不变集的数据点的迭代过程。当NormDataY
= mainvarsetnorm(..., '迭代',IterateValue
,……)IterateValue
是真正
,mainvarsetnorm
重复该过程,直到没有更多的数据点被消除,或数据点的预定百分比(PercentileValue
)。当IterateValue
是假
,只执行流程的一次迭代。默认是真正
。
选择假
对于较小的数据集,通常小于200个数据点。
选择平滑方法对数据进行归一化。当NormDataY
= mainvarsetnorm(..., '法',MethodValue
,……)MethodValue
是“洛斯”
,mainvarsetnorm
使用lowess方法。当MethodValue
是'runmedian'
,mainvarsetnorm
使用运行中位数法。默认是“洛斯”
。
将针对平滑方法的窗口大小。如果NormDataY
= mainvarsetnorm(..., '跨度',SpanValue
,……)SpanValue
小于1,窗口大小是数据点的数量的该百分比。如果SpanValue
等于或大于1时,窗口的大小是多少SpanValue
。默认是0.05
,其窗口大小等于不变集中数据点总数的5%。
确定是否绘制对M-A散点图(前和归一化之后)。M是之间的比率NormDataY
= mainvarsetnorm(..., 'Showplot',ShowplotValue
,……)DataX
和DataY
。A是的平均值DataX
和DataY
。当ShowplotValue
是真正
,mainvarsetnorm
绘制M-A散点图。默认是假
。
曾国忠,吴敏kyu,罗林,廖,廖锦昌,王文辉(2001)发表于cDNA微阵列分析:品质过滤、通道归一化、变异模型与基因效应评估。核酸的研究。29,2549年至2557年。
[2]霍夫曼,R.,塞德尔,T。,和杜格斯,M。(2002)上的检测寡核苷酸的微阵列数据分析的差异表达基因正常化深刻的影响。基因组生物学。3(7):研究0033.1-0033.11。