主要内容

cigar2align

使用雪茄格式的签名将未对齐的序列转换为对齐的序列

描述

例子

对齐= cigar2align (seq雪茄中转换未对齐的序列seq对齐使用存储在雪茄

例子

GapSeq指数] = cigar2align(seq雪茄中转换未对齐的序列seqGapSeq,并返回指数,一个数值索引向量,使用存储在雪茄.当一个对齐有很多列时,这种语法使用的内存更少,速度更快。

例子

___= cigar2align (seq雪茄名称,值,对于任何输出,使用一个或多个名称-值参数指定附加选项。例如,要在参考序列中有输出显示间隙,使用对齐= cigar2align(Seqs,雪茄,GapsInRef=true)

例子

全部折叠

创建包含未对齐序列的字符向量的单元格数组,创建与ACGTATGC的参考序列相关联的相应cigar格式的字符向量的单元格数组,然后重建对齐。

Seqs = {“ACGACTGC”“ACGTTGC”“AGGTATC”};%未对齐序列雪茄= {' 3 m1d1m1i3m '“4 m1d1p3m”“5 m1p1m1d1m”};% cigar-formatted对齐= cigar2align(Seqs,雪茄)
对齐=3x8字符数组' acg-atgc ' ' acgt-tgc ' ' aggtat-c ' '

重建相同的对齐,以显示与参考序列中的间隙相对应的对齐序列中的位置。

Alignment2 = cigar2align(Seqs,雪茄,GapsInRef=true)
Alignment2 =3x9字符数组“acg-actgc”“acgt - tgc”“aggta-t-c”

的偏移填充重建对齐5

Alignment3 = cigar2align(Seqs,雪茄,开始=[5 5 5],OffsetPad=true)
Alignment3 =3x12字符数组' acg-atgc ' ' acgt-tgc ' ' aggtat-c ' '

使用双输出语法来获得对齐和索引。

[GapSeq, indexes] = cigar2align(Seqs,雪茄)
GapSeq =3 x1细胞{' acg-atgc '} {' acgt-tgc '} {' aggtat-c '}
指数=3×11 1 1

输入参数

全部折叠

未对齐的序列,指定为字符向量的单元格数组或字符串向量。seq必须包含相同数量的元素雪茄

数据类型:字符串|细胞

序列的格式,指定为有效的cigar格式的字符向量或cigar格式的字符串向量的单元格数组。雪茄必须包含相同数量的元素seq

数据类型:字符串|细胞

名称-值参数

指定可选参数对为Name1 = Value1,…,以=家,在那里的名字参数名称和价值对应的值。名称-值参数必须出现在其他参数之后,但对的顺序无关紧要。

在R2021a之前,使用逗号分隔每个名称和值,并将其括起来的名字在报价。

例子:对齐= cigar2align(Seqs,雪茄,GapsInRef=true)

指示显示与参考序列中的间隙相对应的对齐序列中的位置,指定为(不显示空白)或真正的.如果你的参考序列有间隙,你设置GapsInRef,然后再使用对齐作为输入align2cigar,返回的cigar格式的字符向量将与原始字符向量不匹配。

例子:真正的

数据类型:逻辑

指示在每个对齐序列的左侧添加填充空白,指定为(不添加填充)或真正的.添加的填充在每个对齐的读序列的左侧放置空白。起始位置的偏移量是从参考序列的第一个位置开始的。当,对齐序列的矩阵从最左边的对齐读序列的起始位置开始。

例子:真正的

数据类型:逻辑

在与软剪切结束相对应的已对齐读序列中包含字符的指示,指定为(不包括)或真正的

例子:真正的

数据类型:逻辑

每个对齐序列开始的参考序列位置,指定为正整数向量。默认情况下,每个对齐的序列从参考序列的位置1开始。

数据类型:|

输出参数

全部折叠

对齐的序列,作为字符数组返回。每行对齐表示一个对齐序列。的行数对齐等于其中的字符向量的个数seq

不带任何前导或尾随空格的对齐序列,返回为字符向量的单元格数组。其中的数字字符向量GapSeq等于其中的字符向量的个数seq

中的起始列的索引对齐,作为数字向量返回。中返回的序列GapSeq对齐输出除了那些在GapSeq没有前导或尾随空格。

条目指数不一定与每个对齐序列的参考序列中的起始位置相同。这是因为以下任何一种情况都适用:

  • 可以扩展引用序列来考虑插入。

  • 对齐序列可以具有前导软剪切、填充或插入字符。

算法

cigar2align重建对齐时,它不会显示硬剪切位置(H)或软剪切位置(S)。此外,它也不会将软剪切位置作为对齐序列的起始位置。

选择功能

中捕获了您的CIGAR信息签名的属性BioMap对象时,可以使用getAlignment方法来构造对齐。

版本历史

在R2010b中引入