用户故事

疾病控制和预防中心自动化脊髓灰质炎病毒测序和跟踪

挑战

万博1manbetx通过跟踪脊髓灰质炎病毒的传播和演变,支持全球根除脊髓灰质炎行动

解决方案

使用MathWorks工具进行基因测序,生成系统发育树,并生成用于指导免疫计划的报告和地图

结果

  • 手动工作流,自动化和加速
  • 聚类分析时间缩短了数月
  • 独立测序工具开发

MATLAB、生物信息学工具箱和MATLAB编译器使CDC能够在单个环境中简化许多手动步骤。过去需要三天的过程现在可以在几个小时内完成,允许实验室专注于对脊髓灰质炎免疫计划非常重要的研究。

脊髓灰质炎病毒粒子。

本文的存在并不声称、推断或暗示CDC或美国政府的认可,即支持本MathWorks软件工具胜过任何其他类似软件、MathWorks组织或任何其他MathWorks产品。万博1manbetx

脊髓灰质炎病毒在世界大部分地区已被消灭,但仍在若干国家活跃,包括阿富汗、印度、尼日利亚和巴基斯坦。疾病控制和预防中心通过向小儿麻痹症流行国家和伙伴机构提供流行病学和技术专门知识,支持世界卫生组织(世卫组织万博1manbetx)的根除小儿麻痹症倡议。

CDC的脊髓灰质炎分子流行病学实验室(PMEL)对脊髓灰质炎病毒样本进行测序,以确定其遗传特征,并监测病毒的变化和传播。该实验室编写了全面的报告,使研究人员能够了解病毒在复制过程中如何演变,并帮助卫生机构开展更有效的免疫运动。

MATLAB®和相关工具箱加速了CDC的病毒跟踪和报告过程。MathWorks工具使CDC能够在管理和分析基因测序数据的工作流程中自动化许多步骤。因此,CDC人员在常规定性和报告任务上的时间减少了,而在应用研究上的时间增加了。

挑战

疾控中心实验室处理来自西非实验室的患者数据和基因样本序列。小儿麻痹症的结果汇编在一份供世卫组织使用的详细月度报告中。该报告中包括一份系统发育树(树形图),显示了过去三年在该地区流行的病毒以及它们之间的关系。

过去,编写这份报告并绘制脊髓灰质炎病毒疫情分布图是一个劳动密集型的过程,涉及多个平台和技术,包括微软®访问数据库和UNIX®基于程序和脚本。

收集3000个序列的所有数据,然后进行标记、颜色编码,并将病毒分离成遗传谱系的簇,耗时长达3天。这个过程非常复杂,交叉训练其他人来完成这个任务的学习曲线非常陡峭。

CDC需要使用其他实验室人员可以使用的工具自动化这个工作流,并以易于分发和理解的格式生成报告。

解决方案

MATLAB、生物信息学的工具箱,以及其他工具箱为CDC构建简化脊髓灰质炎病毒跟踪和报告过程的工具提供了一个平台。

为了将患者数据与个别菌株联系起来,研究人员使用了数据库工具箱读取患者信息,包括每个基因样本的日期和位置,到MATLAB中,在那里他们将其链接到使用生物信息学工具箱导入的fasta格式文件中的测序信息。

为了分析遗传数据并识别基因相似的病毒簇,CDC的研究人员使用生物信息学工具箱、统计学和机器学习工具箱对遗传序列进行比对,并生成连接邻居的系统发育树.该团队与MathWorks顾问合作,开发了一种基于MATLAB的聚类分析工具,可以根据血清型和基因型对病毒进行分类,然后将它们分离成相关病毒的聚类。

该团队使用Mapping Toolbox在区域地图上用彩色标记点绘制这些簇.群集分布图使卫生机构能够看到脊髓灰质炎病毒活跃的地方,并发现病毒传播的模式。

为了简化整个工作流程,CDC PMEL使用MATLAB Compiler构建了独立的程序.这些程序有一个界面,可以方便地选择数据库和文件,用患者信息注释树突状图,并生成月度报告。更广泛的注释系统发生树的文档使用MATLAB报告生成器生成

在一个相关的项目中,CDC的研究人员正在研究脊髓灰质炎病毒是如何变异和进化的。例如,他们使用MATLAB和生物信息学工具箱来模拟脊髓灰质炎病毒基因组在100年期间的突变。这项研究的结果将帮助卫生组织了解免疫计划如何影响病毒进化。

美国疾病控制与预防中心PMEL正在帮助巴基斯坦、印度和南非的各种专门国际脊髓灰质炎研究实验室采用美国疾病控制与预防中心开发的基于MATLAB的测序和分析工具。

结果

  • 手动工作流,自动化和加速.制作每月的小儿麻痹症报告过去需要三天时间。使用CDC用MATLAB、生物信息学工具箱和MATLAB编译器构建的工具,任何受过最低程度培训的技术人员都可以在大约一个小时内生成报告。

  • 聚类分析时间缩短了数月.在过去,CDC的研究人员手工指定人群,在大型海报上书写,并结合来自电子表格的基因差异数据。这是一项历时三个月的巨大努力。使用基于MATLAB的聚类分析工具,所有的数据都在一个地方。这个过程有很好的文档记录,疾控中心的研究人员可以在一周内集中精力完成。

  • 独立测序工具开发.CDC脊髓灰质炎小组使用MATLAB Compiler部署的测序工具将显著改善区域内结果的及时性和交流。没有安装MATLAB的研究实验室的病毒学家可以使用这些工具来绘制自己的地图,标记它们的系统发育树,并确定病毒出现的位置。