癌症诊断与深度学习和光子时间伸展
brhram Jalali,克莱尔力帆Chen和Ata Mahjoubfar,加州大学洛杉矶分校(UCLA)
癌症患者接受化疗或immunotherapy-based治疗必须经过常规CT和PET扫描和在某些情况下,新的活检来评估治疗的疗效。流式细胞术,方法确定循环肿瘤细胞(ctc)通过一个简单的血液测试,比扫描和微创活检,可以改变癌症治疗。
在流式细胞仪,细胞检查他们一个一个通过一个小孔在流式细胞分析仪。在传统的流式细胞术,细胞需要荧光标记,从而影响细胞行为和妥协的可行性。成像流血细胞计数器不需要标签,但在相机的速度超过每秒2000细胞产生模糊图像,使其不切实际的屏幕一个细胞群足以发现罕见的异常细胞。
我们组在加州大学洛杉矶分校的光子实验室开发了一段时间量化相位成像(TS-QPI)系统,使大样本大小的准确分类没有生物标记标签(图1)。该系统结合成像流式细胞术,光子时间拉伸技术(见边栏),机器学习算法在MATLAB开发的®,可以分类细胞有超过95%的准确率。
选择功能
TS-QPI系统生成一系列数据每第二轮100 g的数据,相当于每秒20高清电影。一个实验,每一个细胞都在10-milliliter血液样本在每秒近100000细胞成像,系统生成从10到50 tb的数据。
在MATLAB的图像处理工具箱™,我们开发了一个机器视觉管道从细胞中提取生物物理特性的图像。管道还包括CellProfiler,一个开源的细胞图像分析程序用Python编写的®。我们从每个细胞提取超过200功能,分为三类:形态学特征描述细胞的大小和形状,光学相位特性与细胞的密度,和光学损耗特性与细胞内的细胞器的大小。线性回归显示,16的这些特性包含分类所需的大部分信息。
评估机器学习算法
MATLAB的一个主要好处是能够测试各种各样的机器学习模型在很短的时间。我们比较四个从统计和机器学习的分类算法工具箱™:朴素贝叶斯、支持向量机(SVM),逻辑回归(LR),和一个深层神经网络(款)由交叉熵和反向传播训练。万博1manbetx
实验中使用一个已知浓度的样品ctc,所有四个算法(贝叶斯、支持向量机、LR、款)取得了优于85%的准确率(图2)。我们进一步提高准确性、一致性和平衡我们的机器学习分类的敏感性和特异性结合深度学习与全局优化的接受者操作特征(中华民国)。在MATLAB中实现,这个新方法分类精度提高到95.5%。
用并行计算加速实验
因为我们是处理大型数据时,它经常花了一个多星期来完成我们的图像处理和机器学习的过程。缩短周转时间,我们并行分析使用一个推出这种处理器和并行计算工具箱™。使用一个简单的并行循环(parfor
),我们16个处理器上同时运行我们的流程,减少所需的时间从8天完成分析到一天大约一半。
建模和改进实验装置
在加州大学洛杉矶分校的光子实验室,MATLAB模型发展的主力和数据分析。我们利用MATLAB开发了一个模型的完整的实验装置,从光学和激光脉冲到单个细胞的分类(图3)。
我们使用这个模型来指导增强我们设置。例如,改善信噪比我们使用模型模拟特定的增益系数。仿真结果表明,修改设置如何提高整体性能。
建模和模拟系统在MATLAB挽救了我们几个月的实验时间和指导我们的下一个步骤。我们正在将单个细胞的详细模型纳入整个系统模型。这些模型将使我们之间做出更好的权衡空间分辨率和相位分辨率基于类型的细胞分类。
我们开发的系统并不局限于分类癌症细胞。我们也用它来分类藻类细胞根据其脂质含量和适用性作为生物燃料。唯一我们做出重大改变就是表面涂层内细胞流经的通道。我们没有更改机器学习管道支撑分析(图4);它学会了在自己的光学损失和相位特性更重要比藻类细胞形态特征分类,而反向适用于癌细胞。
光子时间伸展是如何运作的吗
TS-QPI系统创建了一个火车与宽度测量飞秒激光脉冲。眼镜,衍射光栅、镜子、分束器驱散激光脉冲的火车彩虹闪烁,照亮细胞通过血细胞计数器。空间信息在每个细胞中编码脉冲的频谱。光学色散对不同波长的不同延迟组件。以这种方式处理的信号光使他们充分实现实时数字化使用电子模拟-数字转换器(ADC)。
相对较低的光子收集在短脉冲宽度和拉伸造成的光功率下降时间很难检测得到的信号。我们弥补这个损失灵敏度用喇曼放大器。通过放缓信号,同时放大,系统可以同时捕捉定量光学相移和强度损失图像样本的每一个细胞。
2017 - 93090 v00出版