数据格式和数据库
生物信息工具箱™允许您访问的数据库在网络上和其他在线数据存储库。它允许您将数据复制到MATLAB®工作区和读写文件与标准生物格式。也读许多常见基因组文件格式,所以您不必编写和维护自己的文件读者。
基于网络的数据库——你可以直接访问网络上的公共数据库中,序列和基因表达信息复制到MATLAB环境。
目前序列数据库支持基因库万博1manbetx®(getgenbank
),GenPept (getgenpept
),欧洲分子生物学实验室(EMBL) (getembl
)和蛋白质数据库(PDB) (getpdb
)。你也可以访问数据从NCBI基因表达综合(GEO)网站通过使用一个函数(getgeodata
)。
得到繁殖对齐序列(gethmmalignment
)、隐马尔可夫模型简介(gethmmprof
),系统发育树的数据(gethmmtree
)包含了数据库。
基因本体数据库——从网络数据库加载到一个基因本体论对象(geneont
)。本体与方法的选择部分geneont对象(getancestors
,getdescendents
,getmatrix
,getrelatives
),与效用函数和操作数据(goannotread
,num2goid
)。
从设备读取数据来自基因测序仪器读取数据(scfread
,joinseq
,traceplot
),质谱仪(jcampread
)、安捷伦®芯片扫描仪(agferead
)。
读取数据格式——功能的工具箱提供了许多从常见的生物信息学读取数据文件格式。
序列数据:基因库(
genbankread
),GenPept (genpeptread
),EMBL的(emblread
),PDB (pdbread
),和FASTA (fastaread
)用对齐序列:ClustalW和GCG格式(
multialignread
)基因表达微阵列基因表达数据:综合(GEO)数据(
geosoftread
),GenePix®数据在探地雷达和加文件(gprread
,galread
),点数据(sptread
),Affymetrix®GeneChip®数据(affyread
),ImaGene®结果文件(imageneread
)隐马尔可夫模型简介:PFAM-HMM文件(
pfamhmmread
)
写数据格式——从网上获取数据的功能包括将数据保存到一个文件的选项。然而,有一个函数来写入数据到一个文件中使用FASTA格式(fastawrite
)。
爆炸的搜索-请求网络爆炸搜索(blastncbi
),得到一个搜索结果(getblast
)和从以前保存的爆炸读取结果格式化的报告文件(blastread
)。
MATLAB环境对其他行业标准文件格式包括的内置支持万博1manbetx微软®Excel®和逗号分隔值(CSV)文件。额外的功能执行ASCII和低级二进制文件I / O,允许您开发自定义函数来处理任何数据格式。