mainvarsetnorm

对基因表达值从两个实验条件或表型执行秩不变集归一化

语法

NormDataY= mainvarsetnorm (数据X,DATAY)
NormDataY= mainvarsetnorm(…“阈值”,ThresholdsValue,……)
NormDataY= mainvarsetnorm(…“排除”,ExcludeValue,……)
NormDataY= mainvarsetnorm(..., '百分',PercentileValue,……)
NormDataY= mainvarsetnorm(..., '迭代',IterateValue,……)
NormDataY= mainvarsetnorm(..., '法',MethodValue,……)
NormDataY= mainvarsetnorm(..., '跨度',SpanValue,……)
NormDataY= mainvarsetnorm(..., 'Showplot',ShowplotValue,……)

参数

DataX

基因表达值的载体从单一的实验条件或表型,其中每一行对应一个基因。这些数据点作为基准。

DataY

基因表达值的载体从单一的实验条件或表型,其中每一行对应一个基因。这些数据点将使用基线标准化。

ThresholdsValue

为两个数据集之间的最低平均秩和最高平均秩设置阈值的向量。每个数据点的平均秩是通过先将值转换为DataXDataY到队伍中,进行平均,两个级别的每个数据点。然后,对于每个数据点的阈值是由针对最低平均等级阈值和用于最高平均等级阈值之间进行内插来确定。

请注意

这些单独的阈值用来确定秩不变集,这是一组数据点,每个数据点的秩差(prd)都小于其预先设定的阈值。有关秩不变集的更多信息,请参见描述

ThresholdsValue是一个1×2矢量[LT,HT],其中LT是最低的平均等级门槛,H T对于平均最高等级门坎。选择这两个阈值凭经验来限制不变集的蔓延,但允许足够的数据点来确定正常化关系。值必须介于01。默认为[0.03, 0.07]。

ExcludeValue

属性过滤不变组数据点,通过排除数据点的平均等级(间DataXDataY)是最高的N排名平均或最低N排名的平均值。

PercentileValue

物业停止迭代过程,当数据点在不变集河段数N输入数据点总数的百分比。默认是1

请注意

如果不使用此属性,迭代过程将继续,直到没有更多的数据点被消除。

IterateValue

属性来控制用于确定不变集数据点的迭代过程。输入真正重复此过程,直至没有更多的数据点被消除,或已确定数据点的百分比(PercentileValue)。输入仅执行一个过程的迭代。默认是真正

提示

选择对于较小的数据集,通常小于200个数据点。

MethodValue

属性来选择用于标准化数据平滑方法。输入“洛斯”要么'runmedian'。默认是“洛斯”

SpanValue

属性设置为平滑方法中的窗口大小。如果SpanValue小于1,窗口大小是数据点的数量的该百分比。如果SpanValue等于或大于1时,窗口的大小是多少SpanValue。默认是0.05,其窗口大小等于不变集中数据点总数的5%。

ShowplotValue

属性来控制对M-A散点图的标绘(前和归一化之后)。M是之间的比率DataXDataY。A是的平均值DataXDataY。输入真正来创建一对M-A散点图。默认是

描述

NormDataY= mainvarsetnorm (数据X,DATAY)归一化值DataY,一个基因表达值载体,到一个参考载体,DataX使用不变集方法。NormDataY一个标准化的基因表达值载体来自哪里DataY

特别,mainvarsetnorm:

  • 确定比例秩差(珠江三角洲)每一对职级,RankXRANKY从基因表达值的两个向量,DataXDataY

    珠江三角洲= ABS(RankX-RANKY)

  • 通过选取秩差成比例的数据点(珠江三角洲)低于,它是给定数据点(由ThresholdsValue属性)。它选择性地重复这个过程,直到没有更多的数据点被消除,或者达到预定的数据点的百分比。

    不变集为具有a的数据点珠江三角洲<

  • 利用数据点的不变集来计算低值或运行中值平滑曲线,该曲线用于对中值进行归一化DataY

请注意

如果DataX要么DataY包含NaN值,那么NormDataY也将包含在相应的位置NaN值。

提示

mainvarsetnorm是用于双色微阵列数据校正染料偏置是有用的。

NormDataY= mainvarsetnorm(…”,PropertyName”,PropertyValue,……)调用mainvarsetnorm部分可选的属性是使用属性名称/属性值对。您可以按任意顺序指定一个或多个属性。每PropertyName必须用单引号括起来,不区分大小写。这些属性名称/属性值对如下:

NormDataY= mainvarsetnorm(…“阈值”,ThresholdsValue,……)设置两个数据集之间的最低平均秩和最高平均秩的阈值。每个数据点的平均秩是通过先将值转换为DataXDataY到队伍中,进行平均,两个级别的每个数据点。然后,对于每个数据点的阈值是由针对最低平均等级阈值和用于最高平均等级阈值之间进行内插来确定。

请注意

这些单独的阈值用来确定秩不变集,这是一组数据点,每个数据点的秩差(prd)都小于其预先设定的阈值。有关秩不变集的更多信息,请参见描述

ThresholdsValue是一个1×2矢量[LT,HT],其中LT是最低的平均等级门槛,H T对于平均最高等级门坎。选择这两个阈值凭经验来限制不变集的蔓延,但允许足够的数据点来确定正常化关系。值必须介于01。默认为[0.03, 0.07]。

NormDataY= mainvarsetnorm(…“排除”,ExcludeValue,……)过滤不变的数据点集合,通过排除的数据点的平均等级(间DataXDataY)是最高的N排名平均或最低N排名的平均值。

NormDataY= mainvarsetnorm(..., '百分',PercentileValue,……)当不变集中的数据点数达到时,停止迭代过程N输入数据点总数的百分比。默认是1

请注意

如果不使用此属性,迭代过程将继续,直到没有更多的数据点被消除。

NormDataY= mainvarsetnorm(..., '迭代',IterateValue,……)控制用于确定不变集的数据点的迭代过程。当IterateValue真正,mainvarsetnorm重复该过程,直到没有更多的数据点被消除,或数据点的预定百分比(PercentileValue)。当IterateValue,只执行流程的一次迭代。默认是真正

提示

选择对于较小的数据集,通常小于200个数据点。

NormDataY= mainvarsetnorm(..., '法',MethodValue,……)选择平滑方法对数据进行归一化。当MethodValue“洛斯”,mainvarsetnorm使用lowess方法。当MethodValue'runmedian',mainvarsetnorm使用运行中位数法。默认是“洛斯”

NormDataY= mainvarsetnorm(..., '跨度',SpanValue,……)将针对平滑方法的窗口大小。如果SpanValue小于1,窗口大小是数据点的数量的该百分比。如果SpanValue等于或大于1时,窗口的大小是多少SpanValue。默认是0.05,其窗口大小等于不变集中数据点总数的5%。

NormDataY= mainvarsetnorm(..., 'Showplot',ShowplotValue,……)确定是否绘制对M-A散点图(前和归一化之后)。M是之间的比率DataXDataY。A是的平均值DataXDataY。当ShowplotValue真正,mainvarsetnorm绘制M-A散点图。默认是

例子

全部收缩

该实施例说明如何校正用于从双色微阵列实验数据的两个信道之间的染料偏压或扫描的差异。

从样品GPR文件中读取微阵列数据。

maStruct = gprread(“mouse_a1wt.gpr”);

从两个不同的实验条件下提取的基因表达值。

cy5data = magetfield(maStruct,“F635中位数”);cy3data = magetfield(maStruct,“F532值”);

正常化cy3data使用cy5data作为参考并绘制结果。

Normcy3data = mainvarsetnorm(cy5data,cy3data,“showplot”,真正的);

在理想的实验条件下,表达值相等的数据点沿M = 0线下降,表示基因表达率为1。然而,染色偏置导致一个通道的测量值高于另一个通道,如归一化前的图所示。标准化纠正了方差,如后归一化图所示。

参考

曾国忠,吴敏kyu,罗林,廖,廖锦昌,王文辉(2001)发表于cDNA微阵列分析:品质过滤、通道归一化、变异模型与基因效应评估。核酸的研究。29,2549年至2557年。

[2]霍夫曼,R.,塞德尔,T。,和杜格斯,M。(2002)上的检测寡核苷酸的微阵列数据分析的差异表达基因正常化深刻的影响。基因组生物学。3(7):研究0033.1-0033.11。

介绍了R2006a