技术文章和通讯

Cybergenetics TrueAllele技术使以前无法使用DNA证据的客观分析

马克·w·佩林博士Cybergenetics


约翰博士在他Blairsville Yelenic被谋杀,2006年宾夕法尼亚州的家里。他的指甲主要包含自己的DNA,而且少量的DNA的人——当他挠他的袭击者存入流经自卫。事实上,这种微量组分的DNA混合物系怀疑凯文·弗利犯罪,用一根火柴统计法医专家说的是13000年。

DNA混合物数据可以为人类专家来解释。他们的实验室协议简化这些数据,通常低估了匹配数量。福利的辩护律师说,指甲证据不排除其他嫌疑人,自从13000年有一个机会,DNA来自他的当事人以外的人。

人类DNA证据的鉴定可以挑战,即使在简单的样品。分析师执行考试需要大量的培训和审查过程是缓慢而冗长。人工解释方法不能消除自然考试偏见。启发式方法截断数据可以抢劫的证据证明的价值。

今天,大多数DNA样本并不简单。它们可以包含DNA,展览退化,或几个人的DNA混合在一起。这些因素复合数据分析的困难。有时专家分析师无法得出一个结论,尽管耗费相当大的努力。因此,宝贵的证据定罪罪犯在法庭上或为无辜的变得不可用。

Cybergenetics TrueAllele®技术和MATLAB开发®使用信号处理和先进的统计方法,从DNA提取识别信息数据。TrueAllele概率的方法更全面,更客观,比人类更快的分析。这些优势让犯罪实验室从以前不确定样本,提取信息,减少积压的证据等待审核。在福利的情况下,TrueAllele启用13000倍比人类专家的估计,客观计算一个有说服力的1890亿个DNA匹配统计有助于保证定罪。

DNA鉴定术语表

背景:一个线性信息分子编码生命的操作系统和程序。DNA是写在四个化学字母的字母(A、C、G和T)。
染色体:一个大包装驻留在细胞核的DNA分子。人类DNA包含23对染色体,一份来自于父亲和母亲。
轨迹:为一个基因编码的染色体上的一个位置或其他DNA序列。
等位基因:基因位点DNA的句子。一个人有两个等位基因(一个母亲和一个父亲)在每一个轨迹,除了X和Y性染色体。
基因型:一个细胞或个体的基因组成。在一个特定的轨迹,个体是一对等位基因的基因型。
标识:分辨一个人从另一个利用自然发生的基因变异。

处理简单的和复杂的DNA样本

DNA测序仪的数据绘制时,一对等位基因明显是一个或两个主要的峰值(图1)。沿着x轴峰值的位置标识等位基因,而其高度沿轴反映了DNA数量。当DNA数据来自一个单一的个体,分析师可以很容易地推断出个体的基因型的峰值。

图1所示。DNA数据显示两座山峰,一个人的(13、15)基因型可以推断。
图1所示。DNA数据显示两座山峰,一个人的(13、15)基因型可以推断。

当一个示例包含不止一个人的DNA,数据和基因型之间的关系可能并不明显。实验室数据包含多个峰值,表明等位基因的贡献和他们的相对量(图2),峰高计算放大DNA分子的数量。计数数据变化之间的重复实验,按照概率法和化学。

图2。从混合样本DNA数据,显示多个峰值。
图2。从混合样本DNA数据,显示多个峰值。

为了解决这个数据变化,人类的DNA证据适用“阈值”。Each laboratory sets its own threshold level, based on an internal calibration. Peaks with a height above this threshold are accorded equal weight, while less use is made of peaks below the threshold. These thresholds do not work well with count data and its variation. Informative DNA samples often end up miscategorized as inconclusive, and are not reported. A more accurate approach is to use computers and probability to mathematically model peak height variance as a parameter of the evidence data.

使用MATLAB分析复杂的DNA样本

TrueAllele技术使用MATLAB信号处理工具箱™,统计和机器学习工具箱™数学分离混合DNA数据成为个人贡献者和各自的基因型。因为解决方案可能不确定,推断基因型值分配概率。

DNA测序器生成laser-detected荧光数据作为一维信号,一个五彩缤纷的许多位点的多路复用。TrueAllele分析模块与信号处理工具箱开发过程信号数据去除工件,分类的山峰,确定峰值大小和高度,并执行其它质量检查。

初步分析后,TrueAllele解释数据使用一个概率模型。这个模型包含了数百个变量,包括未知的基因型的个体为样本,DNA量,扭曲了信号放大的工件,这些变量的不确定性。的许多变量是分层的,这意味着它们包含的子,每个都有自己的参数和不确定性。从DNA数据,TrueAllele解决模型通过马尔可夫链蒙特卡罗(密度)统计抽样,用pmmh算法开发统计和机器学习工具。

解释DNA证据,TrueAllele提出100000种不同的可能值的组合解决方案空间变量和评估每个建议的解决方案如何解释DNA数据。基于MATLAB软件计算概率密度,然后生成一个概率分布的可行的解决方案。万博 尤文图斯万博 尤文图斯解决方案,更准确地描述了观测数据有更高的概率,而贫穷解释概率较低。

对于一些样品,计算机几乎可以数学分离混合成单一组件,高概率分配给每个基因型。其他样品,结果不确定和产量的基因型与更加分散的概率。无论如何,基因型的答案是一个概率分布,客观地推断出单独从证据。

当数据支持证据和嫌疑人的基因万博1manbetx型之间的匹配,TrueAllele模型允许分析师计算DNA匹配数据。形成这样的比赛统计,或“似然比,”MATLAB程序比较基因型推断从证据参考基因型的怀疑。消除检测偏差的可能性,这样做比较后电脑基因型推理完成。

代表随机匹配计算包括第三个基因型人群,提供所需的分母比较匹配的概率和巧合。在平实的语言陈述的数学结果,法医科学家可以报告,例如,“证据之间的比赛项目和怀疑的一千万亿倍是巧合。”

开发一个用户界面,添加数据库支持万博1manbetx

呈现TrueAllele结果直观的图片,一个科学家,律师,或陪审员,Cybergenetics利用MATLAB开发了一个可视化的用户界面(VUIer™)的工具。VUIer显示视觉表征的关键变量,如数据、重量、混合基因型因素概率,并匹配强度(图3)。VUIer使“如果”分析替代基因型和混合教学可能是有用的。用户界面计算似然比率和置信区间,并且可以生成一个DNA匹配报告。

轨迹数据视图显示混合山峰。
图3。VUIer用户界面。左上:数据视图显示混合轨迹的山峰。右上:混合视图显示计算机分离为两个组件。左下:基因型视图显示一个匹配的证据(蓝色)和怀疑(深绿色)基因型不匹配另一个人的基因型(浅绿色)。右下角:匹配视图显示,在对数刻度,积极与嫌疑人(蓝色)和其他人的负面不匹配(红色)。

Cybergenetics使用MATLAB编译器™VUIer客户端打包成一个独立的可执行程序。这个用户界面客户端跨平台和运行在Mac OS X和Microsoft®窗户®操作系统。基因分型结果TrueAllele服务器执行密度计算在多台计算机上并行运行,运行Linux®操作系统。MATLAB支持开发在一个环境,可以部署到三个不同的平台。

客户端软件访问TrueAllele VUIer通过数据库工具箱™数据库服务器。这对DNA PostgreSQL数据库作为存储库数据,解释请求,和结果。中央服务器数据库自动通过自定义的坐标系统的操作管理专家系统用MATLAB编写的。

TrueAllele系统提供DNA数据库匹配功能,可以帮助解决犯罪问题,找到失踪的人,或识别人类遗骸。解决一个寒冷的情况下,数据库系统比较基因型推断从案件证据参考基因型与成千上万的潜在的犯罪嫌疑人。TrueAllele情报数据库是高度敏感的和特定的(不像政府供应的软件),因为它使用数学代表基因型和计算强度相匹配。

让世界更加安全

TrueAllele可靠性被广泛认可和经受住了法院可容许的挑战。系统已在美国和在国际上使用超过一百例,罪行包括强奸、杀人、绑架和恐怖。TrueAllele曾在世贸中心灾难来帮助识别受害者仍然存在。凯文·弗利的上诉失败他无期徒刑Yelenic博士的谋杀了宾夕法尼亚州优越和最高法院裁决,建立了全州TrueAllele先例。

是否在Cybergenetics或犯罪实验室,TrueAllele MATLAB解释以前无法使用的生物学证据现在可以计算准确的DNA鉴定信息。

2013 - 92093 v00出版

为相关行业观点文章