主要内容

cghfreqplot

显示频率的DNA拷贝数改变跨越多个样本

语法

FreqStruct= cghfreqplot (CGHData
FreqStruct= cghfreqplot (CGHData……“阈值”,ThresholdValue,……)
FreqStruct= cghfreqplot (CGHData,“组”,GroupValue,……)
FreqStruct= cghfreqplot (CGHData……“Subgrp”,SubgrpValue,……)
FreqStruct= cghfreqplot (CGHData……“次要情节”,SubplotValue,……)
FreqStruct= cghfreqplot (CGHData……“截止”,CutoffValue,……)
FreqStruct= cghfreqplot (CGHData……“染色体”,ChromosomeValue,……)
FreqStruct= cghfreqplot (CGHData……“IncludeX”,IncludeXValue,……)
FreqStruct= cghfreqplot (CGHData……“IncludeY”,IncludeYValue,……)
FreqStruct= cghfreqplot (CGHData……“Chrominfo”,ChrominfoValue,……)
FreqStruct= cghfreqplot (CGHData……“ShowCentr”,ShowCentrValue,……)
FreqStruct= cghfreqplot (CGHData,“颜色”,ColorValue,……)
FreqStruct= cghfreqplot (CGHData……“YLim”,YLimValue,……)
FreqStruct= cghfreqplot (CGHData,“标题”,TitlesValue,……)

输入参数

CGHData

基于阵列的比较基因组杂交(aCGH)数据有以下两种形式:

  • 具有以下字段的结构:

    • 样本-包含样本名称的字符向量或字符串向量的单元格数组(可选)。

    • 染色体-包含克隆所在染色体号的向量。

    • GenomicPosition-包含克隆映射到的基因组位置(以bp, kb或mb为单位)的向量。

    • Log2Ratio-包含日志的矩阵2每个克隆的测试信号强度与参考信号强度之比。每一行对应一个克隆,每列对应一个样本。

  • 矩阵,每一行对应一个克隆。第一列包含染色体编号,第二列包含基因组位置,其余每一列都包含日志2样品的测试信号强度与参考信号强度之比。

ThresholdValue

指定增益/损耗阈值的正标量或向量。一个克隆如果它的日志被认为是一个增益2比率高于ThresholdValue如果是日志,则为损失2比率低于负值ThresholdValue

ThresholdValue应用如下:

  • 如果为正标量,则为所有样本的增益和损失阈值。

  • 如果是一个双元素向量,第一个元素是所有样本的增益阈值,第二个元素是所有样本的损失阈值。

  • 如果一个向量的长度与样本数量相同,则将该向量中的每个元素视为每个样本的唯一增益和损耗阈值。

默认是0.25

GroupValue

指定要从中计算频率的样本组。的选择是:

  • 样本列索引的向量(用于只有一组的数据)。在向量中指定的样本被认为是一组。

  • 样本列索引向量的单元格数组(用于划分为多个组的数据)。单元格数组中的每个元素都被认为是一个组。

默认是所有样本的一个组CGHData

SubgrpValue 按子组控制样品的分析。的选择是真正的(默认)或
SubplotValue 当分析多个子组时,控制在一个图窗口中显示所有图。的选择是真正的(默认)或(在单独的窗口中显示绘图)。
CutoffValue 标量或双元素数字向量,指定一个截止点,该截止点仅控制频率增益或损耗大于或等于的克隆的绘图CutoffValue.如果是两个元素的向量,第一个元素是收益的截止点,第二个元素是损失的截止点。默认是0
ChromosomeValue 单个染色体数或染色体数的向量,它指定要显示其频率图的染色体。默认是所有染色体都在CGHData
IncludeXValue 控制X染色体在分析中的包含。的选择是真正的(默认)或
IncludeYValue 控制在分析中包含Y染色体。的选择是真正的(默认)。
ChrominfoValue

由下列任何一种指定的细胞遗传学带信息:

  • 方法返回的cytobandread函数

  • 指定NCBI表意文字文件或UCSC Genome Browser细胞带文本文件的文件名的字符向量或字符串

默认是智人细胞遗传学带信息来自UCSC基因组浏览器,NCBI Build 36.1 (https://genome.UCSC.edu).

ShowCentrValue

控制着丝点位置在频率图中显示为垂直虚线。的选择是真正的(默认)或

提示

着丝粒位置由ChrominfoValue

ColorValue

图中竖线的配色方案,表示收益和损失的频率,由下列任意一种表示:

  • 返回颜色映射的函数的名称或句柄

  • 包含RGB值的m × 3矩阵。如果M等于1,那么用同一种颜色表示所有的得失。如果M等于2或更多,那么第一行用于收益,第二行用于损失,其余行被忽略。例如,[0 1 0;1 0 0]指定绿色为增益,红色为损耗。

默认配色方案是一个从纯绿色(增益= 1)到黄色(0)到纯红色(损失= -1)的颜色范围。

YLimValue 指明垂直轴上的最小值和最大值的双元素向量。默认是[1]
TitlesValue 字符向量、字符串、字符串向量或字符向量的单元格数组,用于指定添加到绘图顶部的组的标题。

输出参数

FreqStruct 结构,在以下字段中包含频率数据:
  • 集团-结构数组,每个结构代表一组样本。每个结构包含以下字段:

    • 样本-包含组内样本名称的单元格数组。

    • GainFrequency-包含一组样本的每个克隆的平均增益的列向量。

    • LossFrequency-包含一组样本中每个克隆的平均损失的列向量。

  • 染色体-包含克隆所在染色体号的列向量。

  • GenomicPosition-包含克隆基因组位置的列向量。

提示

的输入cghfreqplot函数。

描述

FreqStruct= cghfreqplot (CGHData显示阵列上每个克隆的多个样本拷贝数增加或减少的频率,与它们在染色体上的基因组位置相对比。

FreqStruct= cghfreqplot (CGHData,……”PropertyName',PropertyValue,……)调用cghfreqplot使用属性名/属性值对的可选属性。可以以任意顺序指定一个或多个属性。每一个PropertyName必须用单引号括起来,不区分大小写。这些属性名/属性值对如下:

FreqStruct= cghfreqplot (CGHData……“阈值”,ThresholdValue,……)增益/损耗阈值。一个克隆如果它的日志被认为是一个增益2比率高于ThresholdValue如果是日志,则为损失2比率低于负值ThresholdValue

ThresholdValue应用如下:

  • 如果为正标量,则为所有样本的增益和损失阈值。

  • 如果是一个双元素向量,第一个元素是所有样本的增益阈值,第二个元素是所有样本的损失阈值。

  • 如果一个向量的长度与样本数量相同,则将该向量中的每个元素视为每个样本的唯一增益和损耗阈值。

默认是0.25

FreqStruct= cghfreqplot (CGHData,“组”,GroupValue,……)指定要从中计算频率的样本组。的选择是:

  • 样本列索引的向量(用于只有一组的数据)。在向量中指定的样本被认为是一组。

  • 样本列索引向量的单元格数组(用于划分为多个组的数据)。单元格数组中的每个元素都被认为是一个组。

默认是所有样本的一个组CGHData

FreqStruct= cghfreqplot (CGHData……“Subgrp”,SubgrpValue,……)按子组控制样品的分析。的选择是真正的(默认)或

FreqStruct= cghfreqplot (CGHData……“次要情节”,SubplotValue,……)当分析多个子组时,控制在一个图窗口中显示所有图。的选择是真正的(默认)或(在单独的窗口中显示绘图)。

FreqStruct= cghfreqplot (CGHData……“截止”,CutoffValue,……)指定一个截止值,该值仅控制频率增益或损耗大于或等于的克隆的绘图CutoffValueCutoffValue标量或双元素数值向量。如果是两个元素的数字向量,第一个元素是增益的截止点,第二个元素是损失的截止点。默认是0

FreqStruct= cghfreqplot (CGHData……“染色体”,ChromosomeValue,……)仅显示指定的染色体的频率图ChromosomeValue,它可以是单个染色体数,也可以是染色体数的向量。默认是所有染色体都在CGHData

FreqStruct= cghfreqplot (CGHData……“IncludeX”,IncludeXValue,……)控制着X染色体在分析中的包含。的选择是真正的(默认)或

FreqStruct= cghfreqplot (CGHData……“IncludeY”,IncludeYValue,……)控制了Y染色体在分析中的包含。的选择是真正的(默认)。

FreqStruct= cghfreqplot (CGHData……“Chrominfo”,ChrominfoValue,……)指定染色体的细胞遗传学带信息。ChrominfoValue可能是以下任何一种

  • 方法返回的cytobandread函数

  • 指定NCBI表意文字文件或UCSC Genome Browser细胞带文本文件的文件名的字符向量或字符串

默认是智人细胞遗传学带信息来自UCSC基因组浏览器,NCBI Build 36.1 (https://genome.UCSC.edu).

提示

您可以从NCBI或UCSC基因组浏览器ftp站点下载包含细胞遗传学g带数据的文件。例如,你可以下载细胞遗传学的带数据智人来自:

FreqStruct= cghfreqplot (CGHData……“ShowCentr”,ShowCentrValue,……)控制着丝点位置在频率图中显示为垂直虚线。的选择是真正的(默认)或

提示

着丝粒位置由ChrominfoValue

FreqStruct= cghfreqplot (CGHData,“颜色”,ColorValue,……)为图中的垂直线指定配色方案,指示增益和损失的频率。的选择是:

  • 返回颜色映射的函数的名称或句柄。

  • 包含RGB值的m × 3矩阵。如果M等于1,那么用同一种颜色表示所有的得失。如果M等于2或更多,那么第一行用于收益,第二行用于损失,其余行被忽略。例如,[0 1 0;1 0 0]指定绿色为增益,红色为损耗。

默认配色方案是一个从纯绿色(增益= 1)到黄色(0)到纯红色(损失= -1)的颜色范围。

FreqStruct= cghfreqplot (CGHData……“YLim”,YLimValue,……)指定频率图的y垂直极限。YLimValue是一个双元素向量,指定垂直轴上的最小值和最大值。默认是[1]

FreqStruct= cghfreqplot (CGHData,“标题”,TitlesValue,……)指定组的标题,这些标题被添加到图的顶部。TitlesValue可以是字符向量、字符串、字符串向量或字符向量的单元格数组。

例子

全部折叠

绘制来自科里埃尔细胞系研究的数据

加载来自科里埃尔细胞系研究的阵列CGH (aCGH)数据(Snijders, A. et al., 2001)。

负载coriell_baccgh

显示所有样本拷贝数变化的频率图。

Struct = cghfreqplot(coriell_data);

查看有关数据、染色体和着丝粒的数据提示。首先点击数据指针按钮,然后单击黑色染色体边界线,或图中虚线的着丝粒线。若要删除此数据提示,请右键单击它,然后选择删除当前数据提示

,显示显示增益或损失程度的颜色条插入Colorbar按钮。

绘制胰腺癌研究的数据图

载入胰腺癌研究的aCGH数据(Aguirre, a .等,2004)。

负载pancrea_oligocgh

使用绿色和红色配色方案显示所有样本拷贝数变化的频率图。

cghfreqplot (pancrea_data“颜色”, [0 10 0;1 0 0])

绘制aCGH数据组

定义两组数据。

Grp1 = strncmp(“PA.C”pancrea_data.Sample 4);Grp1_ind = find(grp1);Grp2 = strncmp(“爸爸。T 'pancrea_data.Sample 4);Grp2_ind = find(grp2);

显示两组中所有样本拷贝数变化的频率图,并限制绘制频率增益或损失大于或等于0.25的克隆。

SP = cghfreqplot(胰量数据,“集团”, {grp1_ind, grp2_ind},...“标题”,{“氯”“PT”},“截止”, 0.25);

显示第一组中所有样本拷贝数变化的频率图,并将该图仅限制在4号染色体上。

SP = cghfreqplot(胰量数据,“集团”grp1_ind,...“标题”“4号Chr上的CL组”“染色体”4);

使用chromosomeplot函数“addtoplot”选择将智人染色体4的表意文字添加到频率图中。因为胰腺癌研究的频率数据的图是以kb为单位的,所以使用“单位”选项将表意文字数据转换为KB单位。

Fh = gcf;currentAxes = f . currentAxes;chromosomeplot (“hs_cytoBand.txt”4“addtoplot”currentAxes,“单位”2);

参考文献

[1] Snijders, a.m., Nowak, N., Segraves, R., Blackwood, S., Brown, N., Conroy, J., Hamilton, G., Hindle, a.k., Huey, B., Kimura, K., Law, S., Myambo, K., Palmer, J., Ylstra, B., Yue, J.P, Gray, j.w., Jain, A.N., Pinkel, D.,和Albertson, D.G.(2001)。组装用于全基因组测量DNA拷贝数的微阵列。自然遗传学29, 263 - 264。

[2]阿吉雷,a.j.,布伦南,C.,贝利,G.,辛哈,R.,冯,B.,里奥,C.,张,Y.,张,J.,甘斯,j.d.,巴迪斯,N.,考维尔斯,C., Cordon-Cardo, C.,雷德斯顿,m.s.,德平尼奥,R.A,和Chin, L.(2004)。胰腺癌基因组的高分辨率表征。PNAS101年,24, 9067 - 9072。

版本历史

在R2008a中介绍