超:BioRead
包含序列,质量,对准和映射数据
该BioMap
类从短读序列,包括序列标头,读序列,质量评分为序列,以及有关如何每个序列对准到给定的基准数据包含数据。这个数据通常是由高通量测序仪获得。
构造一个BioMap
对象从短读取的序列数据。对象中的每个元素都有一个序列、标题、质量分数和与之关联的对齐/映射信息。在分析或查看数据之前,使用对象属性和方法探索、访问、筛选和操作所有或部分数据。
结构体BioMapobj
= BioMapBioMapobj
,这是一个空BioMap
对象。
结构体BioMapobj
= BioMap (文件
)BioMapobj
, 一个BioMap
对象,从文件
中,SAM-或BAM格式的文件,其中的读出是通过在参考序列的开始位置排序。该数据仍然在源文件中,以及BioMap
它使用一个或两个辅助索引文件对象访问。对于SAM格式的文件,MATLAB®使用或创建一个索引文件必须具有相同的名称作为源文件,但与.IDX
延期。对于BAM格式的文件,MATLAB使用或创建必须具有相同的名称为源文件中的两个索引文件,但* .bai
和* .linearindex
扩展。如果在与源文件相同的文件夹中没有找到索引文件,则BioMap
构造函数创建该文件夹中的索引文件。
当您在一个无序BAM格式的文件传递,构造自动订单文件,并使用相同的基本名和扩展名与扩展之前“.ordered”增加的特征向量将数据写入到一个有序的文件。新的文件索引和用于实例化新BioMap
对象。
因为数据保留在源文件中,使用索引文件访问:
不要删除源文件(SAM或BAM)。
不要删除索引文件(*。idx
, *。白
, 要么 *。linearindex
)。
您不能修改BioMapobj
属性。
结构体BioMapobj
= BioMap (结构
)BioMapobj
, 一个BioMap
对象,从结构
,含MATLAB结构序列和取向的信息,如由返回samread
要么bamread
函数。从数据结构
保存在内存中,使您可以修改BioMapobj
属性。
构建了BioMapobj
= BioMap (___”的名字
”,值
)BioMap
对象使用任何的前面的输入参数和附加选项,指定为名称 - 值对的参数如下。
选择一个或当源数据包含映射到一个以上的参考序列的更多的引用。默认情况下,构造包括所有源文件的头部词典的引用。当标题字典不可用,构造函数默认为包括在源数据中发现的所有参考名称。BioMapobj
= BioMap (___,“SelectReference”
,SelectRefValue
)SelectRefValue
是一个字符向量,字符串,字符串矢量,或字符向量的单元阵列。通过使用此选项,可以防止BioMap
构造函数从引用,你不会在你的分析中使用创建辅助索引文件。如果任何读取映射到所选择的参考配对和BioMapobj
写入文件时,伙伴的引用序列也包含在文件头中。
指定是否将内存中的数据或者在源文件中留下的数据。在源文件中留下的数据,并透过一个索引文件是更多的内存效率,但不会让你修改的属性BioMapobj
= BioMap (文件
,'在记忆中'
,InMemoryValue
)BioMapobj
。的选择是真正
要么假
(默认)。如果第一个输入参数不是文件名,那么这个名称-值对参数将被忽略,数据将自动放在内存中。
设置'在记忆中'
名称 - 值对参数真正
如果要修改的属性BioMapobj
。
指定索引文件(*)所在文件夹的路径。BioMapobj
= BioMap (___,“IndexDir”
,IndexDirValue
)idx
, *。白
, 要么 *。linearindex
)或者存在或将被创建。
使用“IndexDir”
名称 - 值对的说法,如果你没有到源文件所在的文件夹的写权限。
结构体BioMapobj
= BioMap (___,'序列'
,SequenceValue
)BioMapobj
, 一个BioMap
对象,从SequenceValue
包含核苷酸序列的字母表示。如果将数据读入内存,此名称 - 值对才有效。
结构体BioMapobj
= BioMap (___,“标头”
,HeaderValue
)BioMapobj
, 一个BioMap
对象,从HeaderValue
包含核苷酸序列的标题文本。如果将数据读入内存,此名称 - 值对才有效。
结构体BioMapobj
= BioMap (___,'质量'
,QualityValue
)BioMapobj
, 一个BioMap
对象,从QualityValue
包含的每个碱基质量分数对于核苷酸序列的ASCII表示。如果将数据读入内存,此名称 - 值对才有效。
结构体BioMapobj
= BioMap (___,'参考'
,ReferenceValue
)BioMapobj
, 一个BioMap
对象,并设置参考
属性ReferenceValue
包含参考序列的名称。如果将数据读入内存,此名称 - 值对才有效。
结构体BioMapobj
= BioMap (___,'签名'
,SignatureValue
)BioMapobj
, 一个BioMap
对象,从SignatureValue
包含描述与参考序列中的每个读出序列的比对信息。如果将数据读入内存,此名称 - 值对才有效。
结构体BioMapobj
= BioMap (___,'开始'
,StartValue
)BioMapobj
, 一个BioMap
对象,从StartValue
的正整数,指定在各读出序列的比对开始所述参考序列中的位置的向量。如果将数据读入内存,此名称 - 值对才有效。
结构体BioMapobj
= BioMap (___,'旗'
,FlagValue
)BioMapobj
, 一个BioMap
对象,从FlagValue
,指示供SAM格式规范中规定的11个标志的状态的逐位信息正整数的向量。这些标志描述的读取序列的不同的测序和对准方面。如果将数据读入内存,此名称 - 值对才有效。
结构体BioMapobj
= BioMap (___,“MappingQuality”
,MappingQualityValue
)BioMapobj
, 一个BioMap
对象,从MappingQualityValue
,一个正整数向量,指定每个读取序列的映射质量。如果将数据读入内存,此名称 - 值对才有效。
结构体BioMapobj
= BioMap (___,'MatePosition'
,MatePositionValue
)BioMapobj
, 一个BioMap
对象,从MatePositionValue
,非负整数指定为每个配合位置的向量读取序列。如果将数据读入内存,此名称 - 值对才有效。
|
字符向量或字符串指定SAM-或BAM格式的文件只包含一个参考序列,其读取通过在参考序列的开始位置排序。 |
|
|
|
中指定引用序列名称的字符向量、字符串、字符串向量或字符向量的单元数组 |
|
逻辑指定是否将内存中的数据或者在源文件中留下的数据。在源文件中留下数据,并通过一个索引文件访问是更多的内存效率,但不会让你修改的属性 默认: |
|
指定索引文件存在或将要创建的文件夹的路径的字符向量或字符串。 默认:文件夹中 |
|
包含核苷酸序列字母表示的字符串向量或字符向量的单元数组。此信息填充 |
|
字符串向量或字符向量的单元数组,包含核苷酸序列按基质量分数的ASCII表示。此信息填充 |
|
串矢量或包含核苷酸序列的标题文本字符向量的单元阵列。此信息填充 |
|
属性的字符向量或字符串 默认: |
|
串矢量或包含参考序列的名称字符向量的单元阵列。此信息填充对象的 |
|
串矢量或包含描述与参考序列中的每个读出序列的比对信息的字符向量的单元阵列。该 |
|
正整数的向量指定在所述参考序列中的位置,其中每个读出的序列开始的比对。此信息填充对象的 |
|
指示供SAM格式规范规定的11个标志的状态逐位信息正整数的向量。这些标志描述的读取序列的不同的测序和对准方面。此信息填充对象的 |
|
正整数指定为每个读取序列的映射质量的向量。此信息填充对象的 |
|
非负整数指定为每个读序列大副位置的矢量。此信息填充对象的 |
|
与所有阅读序列相关联的旗帜在表示 正整数的载体中,使得存在用于对象中的每个读序列的整数。每个整数表示指定由SAM格式说明书中描述的11个标志的状态逐位信息。这些标志描述读取序列的不同测序和比对方面。元素的数量和顺序之间存在一个一对一的关系 |
|
与所有阅读序列相关联的标头中所表示的 字符向量的单元阵列中,使得存在于对象中的每个读取序列的标头。头可以是空的。元素的数量和顺序之间存在一个一对一的关系 |
|
中所表示的所有读序列的配对位置 非负整数的载体中,使得存在用于对象中的每个读序列的整数。每个整数指示对应的伴侣序列相对于参考序列中的位置,。元素的数量和顺序之间存在一个一对一的关系 在不是所有的值 |
|
中所表示的所有读取序列相关联的映射质量分数 整数向量,这样对象中的每个读序列都有一个映射质量分数。元素的数量和顺序之间存在一个一对一的关系 |
|
的说明 描述字符向量 默认: |
|
在序列数 此信息是只读的。 |
|
中所表示的所有读取序列的每基质量分数 字符向量的单元阵列中,使得存在于对象中的每个读出序列的质量。每个质量是每碱基质量分数为读序列的ASCII表示。质量可以是一个空字符向量。元素的数量和顺序之间存在一个一对一的关系 |
|
在参照序列
参考序列是针对其读出的序列进行比对的序列。 |
|
在读取序列 单元阵列包含所读取的序列的信表示字符向量。 |
|
字符向量的单元阵列编目引用的名称中的可用 此信息是只读的。 |
|
与所有阅读序列相关联的对准信息在表示 雪茄格式化字符向量的单元阵列中,使得存在于对象中的每个读出的序列比对信息。每个字符向量表示如何读序列对准到的参考序列。签名可以是空的字符向量。元素的数量和顺序之间存在一个一对一的关系 |
|
所有排列阅读序列的开始位置的代表 整数的向量,使得存在用于对象中的每个读出顺序的开始位置。每个整数指定对准读取序列相对于参考序列的位置编号的起始位置。元素的数量和顺序之间存在一个一对一的关系 |
filterByFlag | 筛选序列读取由SAM标志 |
getAlignment | 表示的构造对齐BioMap 目的 |
getBaseCoverage | 中返回参考序列的碱基对碱基比对覆盖BioMap 目的 |
getCompactAlignment | 中表示的紧致对齐BioMap 目的 |
getCounts | 读取序列的返回计数对准参考序列中BioMap 目的 |
getFlag | 检索读取序列标志BioMap 目的 |
getIndex | 返回与引用序列对齐的读序列的索引BioMap 目的 |
getInfo | 的单个元素检索信息BioMap 目的 |
getMappingQuality | 检索来自序列映射的质量分值BioMap 目的 |
getMatePosition | 检索来自阅读序列配对的位置BioMap 目的 |
getReference | 检索参考序列BioMap 目的 |
getSignature | 检索来自签名(对准信息)BioMap 目的 |
getStart | 检索对准读取序列的起始位置BioMap 目的 |
getStop | 从对齐阅读序列的计算停止位置BioMap 目的 |
getSummary | 打印的汇总BioMap 目的 |
setFlag | 设置读取顺序为标志BioMap 目的 |
setMappingQuality | 集合列映射质量得分BioMap 目的 |
setMatePosition | 在读取序列的设置位置的队友BioMap 目的 |
setReference | 参考序列集名称BioMap 目的 |
setSignature | 集签名(校准信息)BioMap 目的 |
setStart | 在排列阅读序列的设置开始位置BioMap 目的 |
结合 | 合并两个对象 |
得到 | 检索对象的属性 |
getHeader | 从对象中检索序列标头 |
getQuality | 检索对象的序列的质量信息 |
某个getSequence | 检索对象的序列 |
getSubsequence | 检索对象的部分序列 |
getSubset | 检索对象元素的子集 |
组 | 设置对象属性 |
的setHeader | 更新读取的标题信息 |
setQuality | 更新质量信息 |
setSequence | 更新阅读序列 |
setSubsequence | 更新部分序列 |
setSubset | 对象的更新内容 |
写 | BioRead或BioMap对象的内容写入到文件 |
值。要了解值类如何影响复制操作,请参阅复制对象(MATLAB)的MATLAB编程基础文档。
BioMap
对象支持点。万博1manbetx索引中提取,分配和删除数据。