getembl
从EMBL数据库检索序列信息
语法
EMBLData
= getembl (AccessionNumber
)EMBLData
= getembl(…,去整理,ToFileValue
,……)EMBLSeq
= getembl(…”,序列Only',SequenceOnlyValue
,……)EMBLSeq
= getembl(…“超时”,TimeOutValue
,……)
输入参数
AccessionNumber |
序列记录的唯一标识符。输入字母和数字的唯一组合。 |
ToFileValue |
字符向量,指定要将数据保存到的文件名或路径和文件名。如果只指定文件名,则文件将存储在当前文件夹中。 |
SequenceOnlyValue |
控制只检索序列而不检索元数据。的选择是真正的 或假 (默认)。 |
TimeOutValue |
以秒为单位的连接超时,指定为正标量。缺省值是5。详情请参见在这里. |
输出参数
EMBLData |
MATLAB®结构中对应EMBL数据的字段。 |
EMBLSeq |
MATLAB字符向量表示序列。 |
描述
getembl
从欧洲分子生物学实验室(EMBL)数据库检索核苷酸序列信息。该数据库由欧洲生物信息学研究所(EBI)维护。有关EMBL数据库的详细信息,请参见
在EMBL数据库中搜寻登入号码(EMBLData
= getembl (AccessionNumber
)https://www.ebi.ac.uk/
)及返回EMBLData
,一个MATLAB结构,其中字段对应EMBL双字符行型代码。每个行类型代码都作为结构中的单独元素存储。
EMBLData
包含以下字段。
场 |
---|
识别 |
加入 |
SequenceVersion |
DateCreated |
DateUpdated |
描述 |
关键字 |
OrganismSpecies |
OrganismClassification |
细胞器 |
参考 |
DatabaseCrossReference |
评论 |
组装 |
功能 |
BaseCount |
序列 |
调用EMBLData
= getembl(…”,PropertyName
”,PropertyValue
,……)getembl
使用属性名/属性值对的可选属性。可以以任意顺序指定一个或多个属性。每一个PropertyName
必须用单引号括起来,不区分大小写。这些属性名/属性值对如下:
将信息保存到embl格式的文件中。EMBLData
= getembl(…,去整理,ToFileValue
,……)ToFileValue
是一个字符向量,指定要将数据保存到的文件名或路径和文件名。如果只指定文件名,则文件将存储在当前文件夹中。
提示
将embl格式的文件读入MATLAB软件emblread
函数。
控制只检索序列而不检索元数据。的选择是EMBLSeq
= getembl(…”,序列Only',SequenceOnlyValue
,……)真正的
或假
(默认)。
设置从EMBL数据库检索数据的连接超时时间(以秒为单位)。EMBLSeq
= getembl(…“超时”,TimeOutValue
,……)
例子
检索大鼠肝脏载脂蛋白A-I的数据。
emblout = getembl('X00558')
检索大鼠肝脏载脂蛋白A-I的数据并保存到文件中rat_protein
.如果指定的文件名不包含路径,则文件将存储在当前文件夹中。
emblout = getembl('X00558','ToFile','c:\project\rat_protein.txt')
只检索大鼠肝脏载脂蛋白A-I的序列。
Seq = getembl('X00558','SequenceOnly',true)
版本历史
R2006a之前介绍过