emblread

从EMBL的文件中读取数据

语法

EMBLData= emblread (文件)
EMBLSeq= emblread (文件“SequenceOnly”,SequenceOnlyValue)

输入参数

文件

下面的:

  • 特征向量或字符串指定一个文件名,路径和文件名或URL指向一个文件。是一个EMBL-formatted文件的引用文件。如果你仅指定一个文件名,文件必须在MATLAB®搜索路径或MATLAB当前文件夹。

  • 特征向量或字符串包含EMBL-formatted的文本文件

提示

您可以使用getembl函数与“去整理”属性检索数据的欧洲分子生物学实验室(EMBL)数据库,并创建一个EMBL-formatted文件。

SequenceOnlyValue 控制阅读的顺序没有元数据。的选择是真正的(默认)。

输出参数

EMBLData 与字段对应EMBL的数据结构。
EMBLSeq 特征向量代表序列。

描述

EMBLData= emblread (文件)读取的数据文件,并创建一个EMBL-formatted文件EMBLData,MATLAB结构包含字段对应EMBL的高价票类型代码,基于107年发布的EMBL-Bank平面文件格式。类型代码是存储为一个单独的每一行元素的结构。列表EMBL的高价票线类型代码,看看ftp://ftp.ebi.ac.uk/pub/databases/embl/doc/usrman.txt

请注意

拓扑信息没有包含在EMBL释放87前平面文件数据库。在阅读文件时创建87年发布之前,EMBLREAD返回一个空的Identification.Topology字段。

请注意

条目名称不再显示在EMBL的平面文件的ID行于87年发布。当阅读文件创建在87年发布,加入EMBLREAD返回的数量Identification.EntryName字段。

EMBLSeq= emblread (文件“SequenceOnly”,SequenceOnlyValue)控制阅读的顺序没有元数据。的选择是真正的(默认)。

例子

全部折叠

从网上下载序列信息并保存到一个文件。

= getembl (“X00558”,“去整理”,“rat_protein.txt”);

从EMBL的读取数据文件。

seqData = emblread (“rat_protein.txt”)
seqData =结构体字段:标识:[1×1 struct]加入:“X00558”SequenceVersion:“X00558.1”DateCreated:“13 - jun - 1985 Rel。06年,创造了“DateUpdated:“18 - 4月- 2005 Rel。83年,最后一次更新,版本4的描述:“鼠肝脏载脂蛋白-ⅰmRNA apoA-I……“关键词:”载脂蛋白;脂蛋白;信号肽。”OrganismSpecies:“挪威鼠鼠形……“OrganismClassification(3×75字符):细胞器:“参考:{[1×1 struct]} DatabaseCrossReference:[4×75字符)评论:“大会:“特点:[22×75字符]BaseCount: [1×1 struct]序列:“agctccgggggaggtcgcccacatccttcgggatgaaagctgcag…”

之前介绍过的R2006a