主要内容

RNA序列二级结构的预测和可视化

控件的使用方法rnafoldrnaplot具有预测和绘制RNA序列二级结构的功能。

介绍

RNA在细胞中起着重要的作用,既作为遗传信息载体(mRNA),又作为功能元件(tRNA, rRNA)。由于RNA序列的功能很大程度上与其结构有关,因此从其序列来预测RNA结构变得越来越重要。由于碱基配对和碱基堆叠是RNA折叠过程中自由能贡献的主要组成部分,因此对二级结构进行良好的估算不仅有助于解释RNA分子的功能和反应性,而且有助于分析RNA分子的三级结构。

利用最近邻热力学模型预测RNA二级结构

RNA序列的二级结构是由其碱基之间的相互作用决定的,包括氢键和碱基堆叠。在RNA二级结构预测的许多方法中,有一种是使用最近邻模型来最小化与RNA结构相关的总自由能。通过对碱基对叠加、发夹、凸起、内环和多分支环的能量贡献进行求和,估计了最小自由能。这些元素的能量贡献与序列和长度有关,并已由实验确定。的rnafold函数使用最近邻热力学模型来预测一个RNA序列的最小自由能二级结构。更具体地说,算法实现rnafold利用动态规划计算所有可能的初等子结构的能量贡献,然后考虑其总自由能最小的初等子结构组合来预测次级结构。在此计算中,不考虑同轴堆叠螺旋的贡献,并禁止形成伪节(非嵌套结构元素)。

转移RNA苯丙氨酸的二级结构

trna是一种小分子(73-93个核苷酸),在翻译过程中将特定的氨基酸转移到核糖体部位生长的多肽链上。尽管每种氨基酸类型至少存在一个tRNA分子,但在各种tRNA类型中,二级和三级结构都很保守,这很可能是由于需要维持与核糖体的可靠相互作用。我们考虑以下tRNA-Phe序列来自酿酒酵母并利用该函数预测了最小自由能二级结构rnafold

% ===预测括号符号中的二级结构phe_seq =“GCGGAUUUAGCUCAGUUGGGAGAGCGCCAGACUGAAGAUCUGGAGGUCCUGUGUUCGAUCCACAGAAUUCGCACCA”;phe_str = rnafold (phe_seq)
phe_str  = '(((((((..((((........)))).(((((.......))))).....(((((.......))))))))))))....'

在方括号表示法中,每个点表示一个未配对的碱基,而一对相等嵌套的、开括号和闭括号表示一个碱基对。RNA二级结构的替代表示可以使用该功能来绘制rnaplot.例如,上面预测的结构可以显示为一棵有根的树,其中叶节点对应于未配对的残基,内部节点(除了根)对应于基对。您可以通过单击相应的节点来显示每个残留的位置和类型。

% ===绘制RNA二级结构树状图rnaplot (phe_str“>”phe_seq,“格式”“树”);

tRNA的二级结构通常用曲线图表示,类似于三叶草。它有四个基部配对的茎(或“臂”)和三个环。4个茎均已被广泛研究和鉴定:受体茎(位置1-7和66-72),d茎(位置10-13和22-25),反密码子茎(位置27-31和39-43)和t茎(位置49-53和61-65)。我们可以把tRNA的二级结构画成二维图,每个残基用一个点来标识,主链和氢键用点之间的线表示。茎由连续的配对残基组成(蓝点),而环由未配对残基组成(红点)。

% ===使用点图表示绘制二级结构rnaplot (phe_str“>”phe_seq,“格式”“点”);文本(500、200、“T-stem”);文本(100、600、反密码子干的);文本(550、650、“D-stem干”);文本(700、400、承兑人干的);

虽然所有的茎对于分子的三维折叠以及成功地与核糖体和tRNA合成酶相互作用都很重要,但受体茎和反密码子茎特别有趣,因为它们包括了附着位点和反密码子三联体。附着位点(位置74-76)发生在RNA链的3'端,在所有氨基酸受体茎中由序列C-C-A组成。反密码子三联体由3个碱基组成,它们与信使RNA中的一个互补密码子配对。在pher - trna中,反密码子序列A-A-G(位置34-36)与mRNA密码子U-U-C配对,编码氨基酸苯丙氨酸。我们可以重新绘制结构,并突出这些区域在受体茎和反密码子茎使用选择属性:

aag_pos = 34:36;cca_pos = 74:76;rnaplot (phe_str“序列”phe_seq,“格式”“图”...“选择”(aag_pos cca_pos]);

将其结构表现为曲线图,可以更好地观察到序列分离为四个独立的茎。每个残差用横坐标和半椭圆线表示,这些线连接彼此配对的碱基。二次结构中伪结的缺失反映在相交线的缺失上。这在tRNA二级结构中是可以预见的,因为使用的动态规划方法不允许假结。

rnaplot (phe_str“序列”phe_seq,“格式”“图”);

类似的观察结果可以通过将二级结构显示为一个圆圈来实现,其中每个基底都由一个任意大小的圆的圆周上的一个点来表示,彼此成对的基底用线连接。这些线在视觉上聚集成四个不同的组,由未配对的残基拉伸分开。我们可以用H.Unpaired,手柄随colorby属性设置为状态

[ha, H] = rnaplot(phe_str, H)“序列”phe_seq,“格式”“圆”...“colorby”“状态”);H.Unpaired.Visible =“关闭”;传说;

类的输出rnaplot函数包括MATLAB®结构H由可用于更改各种剩余子集的方面属性的句柄组成。属性设置配色方案colorby属性设置为残留,这些点根据残留类型着色,您可以使用适当的句柄更改它们的属性。

[ha, H] = rnaplot(phe_str, H)“序列”phe_seq,“格式”“圆”“colorby”“残留”
公顷=轴(Bioinfo: rnaplot:圆)属性:XLim: [1] YLim: 1.1000 [1] XScale:“线性”YScale:“线性”GridLineStyle:“-”位置:[0.1125 0.1100 0.6709 0.8150)单位:“正常化”的使用得到显示所有属性H =结构体字段:答:[1 x1线]C: [1 x1线]G: [1 x1线]U: [1 x1线]选择:(0 x1线)

H.G.Color = [0.5 . 0.5 .];H.G.Marker =‘*’;H.C.Color = [0.5 . 0.5 .];H.C.Marker =“+”;

转移RNA苯丙氨酸的保存

尽管tRNAs分子的一级序列存在一些差异,但它们在三个系统发育域上呈现了一个二级结构模式。考虑每个系统发育域的一个代表性生物的tRNA-Phe结构:酿酒酵母真核生物的Haloarcula marismortui为古菌,和栖热菌属酸奶的细菌。然后预测和绘制他们的二级结构使用山地图表示。

酵母=“GCGGACUUAGCUCAGUUGGGAGAGCGCCAGACUGAAGAUCUGGAGGUCCUGUGUUCGAUCCACAGAGUUCGCACCA”;豪迈=“GCCGCCUUAGCUCAGACUGGGAGAGCACUCGACUGAAGAUCGAGCUGUCCCCGGUUCAAAUCCGGGAGGCGGCACCA”;theth =“GCCGAGGUAGCUCAGUUGGUAGAGCAUGCGACUGAAAAUCGCAGUGUCGGCGGUUCGAUUCCGCCCCUCGGCACCA”;yeast_str = rnafold(酵母);theth_str = rnafold (theth);halma_str = rnafold(豪迈);h1 = rnaplot (yeast_str,“序列”、酵母、“格式”“山”);标题(h1,“tRNA-Phe酿酒酵母的);传说隐藏;h2 = rnaplot (halma_str,“序列”豪迈,“格式”“山”);标题(h2,“tRNA-Phe Haloarcula marismortui”);传说隐藏;h3 = rnaplot (theth_str,“序列”theth,“格式”“山”);标题(h3,“tRNA-Phe栖热菌属酸奶的);传说隐藏;

所得到的结构之间的相似性是惊人的,唯一的不同是在d -环上有一个额外的残留物Haloarcula marismortui,显示在山体地块的第一个平坦斜坡上。

G-U摇摆碱基对

除了沃森-克里克碱基对(A-U, G-C)外,几乎每一类功能性RNA都有G-U摆动碱基对。G-U对具有一系列独特的化学、结构和构象性质:它们对金属离子具有高亲和力,在热力学上几乎和沃森-克里克碱基对一样稳定,而且它们在不同环境下具有构象灵活性。在几乎所有的生物中,tRNA受体螺旋第三位的摆动对都是高度保守的。这种守恒表明,G-U对具有独特的特征,很难被其他对复制。根据碱基对的类型进行着色,可以观察二级结构图上碱基对的类型分布。

rnaplot (yeast_str“序列”、酵母、“格式”“图”“colorby”“对”);

参考文献

Matthews, D., Sabina, J., Zuker, M.,和Turner, D.。2 .“RNA二级结构预测的研究与应用”,中国生物医学工程学报,2014,33(5):461 - 468。