生物信息学的工具箱
阅读、分析和可视化的基因组和蛋白质组数据
生物信息工具箱™为下一代测序提供了算法和程序(门店),微阵列分析、质谱、基因本体。使用工具箱函数,你可以阅读基因组和蛋白质组数据的标准文件格式如山姆,FASTA,玻璃纸,和CDF,以及从在线数据库NCBI基因表达等综合和基因库®。你可以探索和可视化数据序列的浏览器,空间的热图,clustergrams。工具箱还提供了统计技术检测山峰,将缺失的数据值,并选择功能。
你可以把工具箱函数支持常见的生物信息学工作流。万博1manbetx您可以使用ChIP-Seq数据识别转录因子;分析RNA-Seq数据识别差异表达基因;识别的拷贝数变异和snp在微阵列数据;和蛋白质进行分类配置文件使用质谱数据。
了解更多关于计算生物学。
开始:
生物信息工具箱为下一代测序提供了算法和可视化技术分析。工具箱可以分析整个基因组在执行计算的碱基对水平分辨率。您可以使用捷浏览器可视化和调查短内容比对使用单头或paired-end短的读取。您还可以构建定制的分析程序,如以下示例所示。
观察和调查短内容对齐
使用捷浏览器,您可以验证和调查短内容的对齐序列支持分析测量遗传变异和基因表达。万博1manbetx捷浏览器让你:
- 可视化短内容数据对齐到一个核苷酸的参考序列
- 比较多个数据集对齐和一个共同的参考序列
- 视图的报道不同的基地和区域的参考序列
- 调查一致读的质量和其他细节
- 由于base-calling错误或多态性识别不匹配
- 想象插入和删除
- 检索功能注释的参考序列相对于一个特定的区域
存储和管理短内容序列数据
下一代测序分析中使用的数据集通常是符合物理内存太大。生物信息学工具箱提供了专门的数据容器,使您能够对整个基因组进行分析。
的BioIndexedFile
对象允许您访问的内容文本文件包含nonuniform-sized条目如序列,注解,和交叉引用的数据集,您可以生成这些对象从表、平面文件或特定于应用程序的格式如山姆,FASTA, FASTQ。
的BioMap
从短内容序列类商店信息,包括序列头,读取序列、质量分数和校准和数据映射到一个单一的参考序列。您可以使用对象属性和方法探索,访问、过滤和操纵BioMap对象中包含的数据。
微阵列正常化
您可以使用正常化微阵列数据的几种方法,包括洛斯,全球的意思是,平均绝对偏差(疯狂),和分位数正常化。可以将这些方法应用到整个微阵列芯片或特定区域或块。过滤和归责功能让你干净的原始数据在运行分析和可视化程序之前。
数据分析和可视化
生物信息学工具允许您执行背景调整和计算从Affymetrix基因(探针集)表达值®微阵列使用健壮的Multi-Array probe-level数据平均(RMA)和GC健壮Multi-Array平均(GCRMA)程序。您可以应用循环二进制全息阵列数据分割和估计的错误发现率从微阵列基因表达数据的多个假设测试实验。您还可以执行rank-invariant设置标准化在探针强度为多个Affymetrix玻璃纸文件或基因表达值从两个不同的实验条件。
专门的微阵列数据的可视化程序包括火山地块,盒子情节,重对数情节,ir情节,和空间热图的微阵列。你也可以想象表意文字与G-banding模式。
使用例程从统计和机器学习的工具箱™,你可以将你的结果,执行分级和k - means聚类,并代表您的微阵列数据在统计可视化中,比如与最优2 d clustergrams叶排序,热量地图,原则组件的阴谋,和分类树。
生物信息工具箱提供了一组质谱数据分析的功能。这些功能使预处理、分类和标记识别从SELDI MALDI, LC / MS、GC / MS数据。预处理功能包括基线校正、平滑、校准和重采样。你可以调整原始光谱数据使用M / Z轴和执行保留时间对齐LC / MS与GC / MS数据。你可以同时对多个光谱图。
你可以平滑、对齐和规范化光谱,然后使用分类和统计学习工具来创建分类和识别潜在的生物标记物
图论和可视化
生物信息学工具使您能够基本图论应用于稀疏矩阵。您可以创建、查看和操纵图形等互动地图,层次结构情节、通路。你可以确定和视图最短路径图,测试周期的有向图,发现两个图之间的同构。
统计学习和可视化
生物信息工具箱提供了函数构建的分类和统计学习算法统计和机器学习工具,包括:
- 万博1manbetx支持向量机(SVM)和邻居分类器
- 函数设置交叉验证实验和测量不同分类方法的性能
- 交互式工具特征选择、映射和显示层次结构情节和途径
基因本体论
生物信息学工具使您能够访问数据库基因本体在MATLAB®解析基因本体论注释文件,获取本体如祖先的子集,后代或亲戚。
序列比对
工具箱提供了函数、对象和序列分析方法,包括成对序列,序列剖面,多重序列比对。这些包括:
- 标准算法的MATLAB实现本地和全局序列比对,如Needleman-Wunsch、均和profile-hidden马尔可夫模型算法
- 进步的多序列比对
- 校准结果的图形化表达矩阵
- 标准得分矩阵,如PAM和BLOSUM矩阵的家庭
- 共识序列计算和序列图标显示
公用事业和序列数据
工具箱允许您操作和分析你的序列数据的更深层次的理解。您可以:
- DNA或RNA序列转换为使用基因编码氨基酸序列
- 对序列进行统计分析和寻找一个序列内的特定模式
- 执行in-silico应用限制性内切酶和蛋白酶消化序列或创建随机序列的测试用例
- RNA序列的二级结构预测最小自由能
序列可视化
工具箱允许您可视化序列和比对。您可以查看序列的线性或圆形映射注释与基因库的特性。你可以想象一个RNA序列的二级结构图。观众互动让你探索和修改成对和多序列比对。
系统发育树分析
工具箱允许您创建和编辑系统发育树。可以计算两两之间的距离对齐或不结盟的核苷酸或氨基酸序列使用广泛的相似性度量如Jukes-Cantor p-distance,比对得分,或一个用户定义的距离的方法。系统发育树构建使用层次链接与各种技术,包括邻居加入,单身,完整的链接,和未加权的两组平均法(UPGMA)。
工具箱支持权重和rero万博1manbetxoting树,计算子树,计算树的规范形式。重新排序,系统发育树查看器允许您删除和重命名分支;探索距离;和读或写Newick-formatted文件。您还可以使用annotation工具MATLAB来创建外观质量树。
蛋白质功能分析
工具箱提供了蛋白质序列分析技术,包括计算例程多肽序列的性质,如原子组成、等电点和分子量。你可以确定蛋白质的氨基酸组成序列,打通与酶蛋白,并创建主干情节和拉马钱德兰PDB数据的情节。您可以使用工具查看属性序列的氨基酸序列或使用分子查看器显示和操作三维分子结构。
文件格式和数据库访问
您可以访问生物数据的标准文件格式,在线数据库和Web站点。生物信息学工具使您可以:
- 从标准文件读取序列数据格式,包括FASTA PDB和自洽场
- 从文件读取微阵列数据格式如Affymetrix DAT, EXP,玻璃纸,共和人民党,和CDF文件;ImaGene®结果格式数据;安捷伦科技公司®特征提取软件文件;和GenePix®探地雷达和加文件
- 从在线数据库读取数据如基因库,EMBL, NCBI BLAST和PDB
- 进口数据直接从NCBI基因表达综合网站用一个命令
- 阅读从NCBI表意文字或细胞遗传学分班信息UCSC cytoband文本文件
- 从MZXML读取质谱数据和JCAMP-DX文件
共享算法和部署应用程序
MATLAB提供的工具,让你把你的数据分析程序变成一个定制的软件应用程序。这包括开发工具来构建用户界面,可视化集成开发环境和分析器。MATLAB应用程序部署的产品让你整合你的MATLAB算法与s manbetx 845现有的C、c++和Java™应用程序部署开发算法和自定义应用程序作为独立的接口,将MATLAB算法转换成微软®. net或COM组件可以访问任何基于COM的应用程序,并创建Microsoft Excel®插件。
你可以集成与BioPerl等常用的生物信息学工具MATLAB,基于soap的Web服务,以及COM插件。