主要内容

数据导入

导入SAM、BAM、FASTA、FASTQ、GTF、GFF文件中的NGS数据和特征注释

导入以FASTA、FASTQ、SAM、BAM等不同文件格式存储的NGS数据。从GTF和GFF文件中读取特性注释。使用各种对象访问和管理NGS数据。例如,BioIndexedFile对象使您能够有效地访问具有非统一大小条目(如序列和注释)的文本文件。当源文件太大而无法装入内存时,使用该对象来访问单个条目或条目的子集。使用BioMapBioRead对象,用于存储和管理包含关于头、质量和对齐信息的序列读取数据。

功能

全部展开

fastainfo 返回FASTA文件的信息
fastaread 从FASTA文件读取数据
fastawrite 写入文件使用FASTA格式
fastqinfo 返回FASTQ文件的信息
fastqread 从FASTQ文件读取数据
fastqwrite 写入文件使用FASTQ格式
saminfo 返回SAM文件的信息
samsort 山姆排序文件
samread 从SAM文件读取数据
baminfo 返回有关BAM文件的信息
bamread 从BAM文件中读取数据
bamsort BAM文件排序
bamindexread 读取BAM索引、BAI、文件

全部展开

BioRead 包含序列读取及其质量数据
BioMap 包含序列、质量、对齐和映射数据
BioIndexedFile 允许快速有效地访问具有非统一大小条目的大型文本文件
GFFAnnotation 包含通用特征格式(GFF)注释
GTFAnnotation 包含GTF (Gene Transfer Format)注释
cuffgffread 过滤和转换GFF和GTF文件
cuffgtf2sam 将GTF文件转换为SAM文件

主题

研究下一代测序数据

使用BioIndexedFile对象使用索引或键从大文件中提取条目,并使用自定义函数解析数据。

管理对象中的顺序读取数据

使用BioMapBioRead对象访问和管理来自FASTQ、SAM、BAM等不同文件格式的NGS数据。

在对象中存储和管理特性注释

使用GTF和GFF特征注释对象从一个或多个引用序列中检索特征信息。

数据格式和数据库

使用各种MATLAB访问在线数据库和存储库®函数并将数据导入工作区以进行进一步分析。

使用Genomics Viewer App可视化NGS数据

使用Genomics Viewer应用程序查看细胞色素p450基因单核苷酸变异的NGS比对数据。

特色的例子