主要内容

getembl

从EMBL数据库检索序列信息

语法

EMBLData= getembl (AccessionNumber
EMBLData= getembl(…,去整理,ToFileValue,……)
EMBLSeq= getembl(…”,序列Only',SequenceOnlyValue,……)
EMBLSeq= getembl(…“超时”,TimeOutValue,……)

输入参数

AccessionNumber 序列记录的唯一标识符。输入字母和数字的唯一组合。
ToFileValue 字符向量,指定要将数据保存到的文件名或路径和文件名。如果只指定文件名,则文件将存储在当前文件夹中。
SequenceOnlyValue 控制只检索序列而不检索元数据。的选择是真正的(默认)。
TimeOutValue 以秒为单位的连接超时,指定为正标量。缺省值是5。详情请参见在这里

输出参数

EMBLData MATLAB®结构中对应EMBL数据的字段。
EMBLSeq MATLAB字符向量表示序列。

描述

getembl从欧洲分子生物学实验室(EMBL)数据库检索核苷酸序列信息。该数据库由欧洲生物信息学研究所(EBI)维护。有关EMBL数据库的详细信息,请参见

EMBLData= getembl (AccessionNumber在EMBL数据库中搜寻登入号码(https://www.ebi.ac.uk/)及返回EMBLData,一个MATLAB结构,其中字段对应EMBL双字符行型代码。每个行类型代码都作为结构中的单独元素存储。

EMBLData包含以下字段。

识别
加入
SequenceVersion
DateCreated
DateUpdated
描述
关键字
OrganismSpecies
OrganismClassification
细胞器
参考
DatabaseCrossReference
评论
组装
功能
BaseCount
序列

EMBLData= getembl(…”,PropertyName”,PropertyValue,……)调用getembl使用属性名/属性值对的可选属性。可以以任意顺序指定一个或多个属性。每一个PropertyName必须用单引号括起来,不区分大小写。这些属性名/属性值对如下:

EMBLData= getembl(…,去整理,ToFileValue,……)将信息保存到embl格式的文件中。ToFileValue是一个字符向量,指定要将数据保存到的文件名或路径和文件名。如果只指定文件名,则文件将存储在当前文件夹中。

提示

将embl格式的文件读入MATLAB软件emblread函数。

EMBLSeq= getembl(…”,序列Only',SequenceOnlyValue,……)控制只检索序列而不检索元数据。的选择是真正的(默认)。

EMBLSeq= getembl(…“超时”,TimeOutValue,……)设置从EMBL数据库检索数据的连接超时时间(以秒为单位)。

例子

检索大鼠肝脏载脂蛋白A-I的数据。

emblout = getembl('X00558')

检索大鼠肝脏载脂蛋白A-I的数据并保存到文件中rat_protein.如果指定的文件名不包含路径,则文件将存储在当前文件夹中。

emblout = getembl('X00558','ToFile','c:\project\rat_protein.txt')

只检索大鼠肝脏载脂蛋白A-I的序列。

Seq = getembl('X00558','SequenceOnly',true)

版本历史

R2006a之前介绍过