技术文章和通讯

利用成像流式细胞术和深度学习进行自动化遗传毒性检测

斯旺西大学的保罗·里斯(Paul Rees)著


遗传毒性分析用于评估对遗传物质(DNA和RNA)的损害由药物等化学试剂引起的,通常用于测试候选药物的安全性。过去,训练有素的实验室技术人员手动进行分析,使用显微镜检查数千个单个细胞,以确定DNA损伤的生物标志物:细胞分裂时形成的微核(MN)(图1)。除了劳动密集型和耗时外,这种方法还取决于每个技术人员的主观判断。

图1所示。左上角:单核细胞;右上:单核微核细胞。左下:双核细胞;右下:带有微核的双核细胞。左:亮场图像;右图:核荧光图像。

我在斯旺西大学的研究小组已经开发了一种基于深度学习和成像流式细胞术(IFC)的遗传毒性和类似研究的自动化方法。我的合作者George Johnson博士的实验室使用IFC从单个细胞收集多通道图像数据。我们使用深度学习网络DeepFlow,这是一个针对IFC[1]进行优化的网络,它使我们能够准确和自动地将图像分类为单核、单核含MN、双核或双核含MN(图2)。

图2。自动图像分类工作流。

这种方法消除了手动方法的主观性,使分析能够在世界各地的实验室中以一致的结果进行®使用深度学习工具箱™,我们可以将代码发送到任何与我们合作的实验室,并知道它将可靠地运行。许多研究人员已经熟悉MATLAB,这意味着他们可以轻松修改或改进代码,并根据具体的实验设置定制DeepFlow。

建筑DeepFlow

我们最初使用Keras TensorFlow实现了DeepFlow™ 但决定在MATLAB中重新实现它,以便DeepFlow可以在世界上几乎任何实验室中使用。我们希望我们的软件能够工作,无论特定实验室使用的是什么流式细胞仪。我们不想担心依赖性,我们希望有一个易于理解和修改的深度学习网络。

我们没有对Keras代码进行逐行翻译,而是使用Deep Network Designer应用程序构建、可视化并训练DeepFlow网络。Keras代码在屏幕的一边,Deep Network Designer应用程序在另一边,我们简单地复制了初始实现的架构(图3)。

图3。Deep network Designer应用中的DeepFlow网络。

我们使用深度学习工具箱中的网络分析仪来检查网络及其层中的错误(图4)。例如,我们从一个为200x200像素的图像设计的网络开始,并将其缩小,以与我们从IFC获得的64x64像素的图像一起工作,利用网络分析仪对网络中每个卷积层的图像大小进行验证。我们的合作者在使用Deep network Designer应用程序对网络进行更改时也会使用网络分析仪。

图4。DeepFlow网络在MATLAB网络分析仪应用程序。

使用DeepFlow进行基因毒性分析

在我们的实验设置中,我们使用的IFC能够在几分钟内处理10,000个细胞。我们用溶液对细胞核和微核进行染色,从而使DNA更清晰可见,并捕捉到亮场图像和荧光图像(图5)。

图5.用于分类和可视化IFC数据的CNN。[1]

我们将IFC数据作为MATLAB数据存储带入MATLAB。我们使用传统的图像处理技术对其进行预处理,根据其强度对每个图像进行重正化,以确保每个图像都在焦点中,细胞完全在帧中。我们使用边缘检测,例如,识别干净的边缘,这表明图像在焦点中,完全平坦的边缘,这表明摄像机没有捕获整个单元。

我们训练DeepFlow CNN使用2000多张人工分类的图像。一旦我们从IFC得到一组标准化的、干净的数据,我们就使用训练过的网络将图像分类为有单核、双核、三核或四核细胞(含或不含MN)的图像。最后,使用一个确定的公式来计算每一类细胞的百分比,我们可以评估用于处理细胞的药剂的毒性。

我们发现,在DeepFlow网络中,紧挨着最终分类层的那一层对于理解训练有素的CNN是如何工作的特别有价值。为了解析嵌入在这一层中的信息,我们使用MATLAB应用一个t-用于可视化高维数据的分布式随机邻居嵌入(tSNE)算法(图6)。这些可视化可以揭示图像数据中的细微差别,这些细微差别在手动检查中几乎无法察觉。例如,分类为双核和单核的细胞与微核之间的关系表明,大小决定了正常细胞核和微核之间的差异。

图6。tSNE可视化数据显示遗传毒性试验的典型细胞类型。

利用弱监督学习将DeepFlow原则扩展到血液质量评估

除了基因毒性研究,我们还在各种分析和分类应用中使用了深度学习。例如,最近,我和我的同事使用CNN和弱监督学习来研究红细胞(rbc)随时间[2]的降解。输血储存血液中的红细胞出现储存损伤,观察到细胞形态的变化,这通常是用显微镜手工评估的。手工评估非常耗时,我们注意到不同的专家通常会得出不同的分数。

在红细胞研究的第一部分,我们继续进行基因毒性研究,用人工标记的属于几种可能形态之一的图像训练CNN,或表型(图7)。经过训练的网络在形态分类方面与专家达成了超过76%的一致,这与专家之间大约79%的一致相当。

图7。红细胞形态。

在研究的第二部分,我们消除了主观的人类标记,并训练了一个弱监督神经网络,ResNet50,只使用血液储存的时间。当我们在基因毒性研究中使用基于tsne的技术可视化结果时,我们发现,该网络已经学会了提取单细胞特征,揭示了形态变化的按时间顺序的进展(图8)。我们意识到,这种进展可以用来预测血液质量和存储血液的过期日期,而无需人工注释。减少血液损耗,帮助确保不适宜的血液不用于输血。

图8。在CNN可视化中显示的表型(形态)的分布。

DeepFlow计划

我们的团队目前正在评估几个将IFC和深度学习与MATLAB结合起来的潜在研究项目。一个项目建立在基因毒性研究的基础上,但重点是评估接受[3]化疗患者的白细胞反应。第二步是将DeepFlow扩展到幻灯片扫描分析,这可能使公司能够重新分析大量的幻灯片扫描数据。我们还在为DeepFlow开发一个图形界面,我们将把它打包成一个单独的、独立的应用程序。

关于作者

Paul Rees博士是斯旺西大学的工程学教授和系统与过程工程中心(SPEC)的负责人。他的研究兴趣包括流式细胞术,生物医学图像分析建模,血凝块模拟,胶体量子点。

2020年出版的

工具书类

  • [1]P., Köhler, N.,布拉西,T.。et al。“利用深度学习重建细胞周期和疾病进展。”自然通讯8,463(2017)。doi:10.1038 / s41467 - 017 - 00623 - 3

  • Doan, M., Sebastian, J.A.等人。“通过深度学习对储存血液质量进行客观评估。”美国国家科学院院刊中国建材建材协会,2016年9月27日。doi:10.1073 / pnas.2001227117

  • [3] Doan, M., Case, M., Masic, D., Hennig, H., McQuin, C., Caicedo, J., Singh, S., Goodman, A., Wolkenhauer, O., Summers, H., Jamieson, D., van Delft, F.W., Filby, A., Carpenter, A. e ., Rees, P.和Irving, J.(2020)。“计算机视觉无标签白血病监测”血细胞计数, 97: 407 - 414。doi:10.1002 / cyto.a.23987

查看相关功能的文章

查看相关行业的文章