型号解释性在MATLAB

爱马仕苏宁，马努工

可解释的机器学习（或深入学习，“解释为AI”）提供了克服AI模型的黑匣子性质的技术和算法。通过揭示各种功能如何贡献（或不贡献）预测，您可以验证该模型正在使用正确的证据，以便其预测，并揭示培训期间不明显的模型偏差。

领型解释性和它解决了使用情况的概述。对于谁是有意采用机器学习，但疲惫的黑盒子模型的工程师和科学家，我们解释解释性如何满足法规，在机器学习建立信任，并验证模型的工作。这是在像金融和地方法规有严格的规定的医疗设备行业尤其重要。我们提供的解释性方法机器学习以及如何在MATLAB®应用它们的概述。我们证明解释性在医疗应用的情况下，分类基于ECG信号心脏心律失常。

近年来，我们在许多智能任务中看到了AI和机器学习算法超越或匹配人类性能，例如医学成像诊断和操作机动车。然而，这些成就的核心缺失是对这些算法如何工作的直观理解。

此视频解释了为什么解释性重要，可解释性存在的方法，并演示如何在MATLAB中使用这些技术。具体而言，我们将研究石灰，部分依赖性地块和允许的预测值重要算法。我们将在分类心电图的语境中审查可解释性。所描述的技术可以应用于任何模型。和此视频不需要遵循医疗背景。

为什么我们需要解释性？要开始，机器学习模型并不直接了解，并且更准确的模型通常不太可解释。此外，需要可解释性方法来帮助在医疗，金融和安全行业中导航监管障碍。

还需要解释的模型，以确保他们使用的是正确的证据，揭示在训练数据的偏差。最近的灾难性使用AI的是信用卡的得分据说那里的算法给出更高的信用额度，以男性超过女性。这可能是由于在训练数据的偏差，在实时数据，还是其他什么东西的偏见。解说模型帮助我们避免这些问题。

对于我们的例子中，你将解释性适用于训练，基于ECG数据从两个公开可用的数据库分类心跳如无论是异常还是正常机器学习模型。心电图代表了心脏的从窦音符电刺激反应，通常分解成QRS方式。我们将使用Matlab的小波工具箱，从原始信号数据自动提取QRS波的位置。从那里，我们提取的用于训练从R峰八大功能。

一旦我们拥有功能，我们就可以使用分类学习者快速培训模型。在这里，我们培训了一个决策树作为固有地解释模型的示例，以及两个复杂的模型。如果重要的话，这只是选择最高的表现模型。然而，在预测生命关注的终结之类的情况下，可解释性具有重要意义。我们希望确保模型正在使用正确的证据来预测，并在模型可能出现错误时理解情况。

使用Matlab的轮排预测功能，我们可以看到，我们的表现最好的模式，随机森林中，R波的振幅都列为重要的预测。然后我们可以使用Matlab的部分家属地块量化的模型输出的R-幅度的影响。我们看到，作为振幅接近0，这有助于在输出异常心跳分类的概率的5％的变化。

但是，这与我们的域名知识相矛盾。专家表示，R幅度级别对心跳的分类几乎没有影响。我们希望确保数据中的这些偏差不包括在我们的模型中。所以接下来，我们恢复了我们没有幅度的模型作为预测因子。一旦我们删除了偏见，我们就可以看到我们的新决策树如何在全球范围内工作。该树代表RR0和RR2间隔的RR0和RR2间隔将成为最重要的预测因子而不是关注R型幅度。

对于更复杂的模型，如我们的随机森林，我们再次使用部分依赖性地块，了解我们最重要的预测因子如何影响模型。我们看到极度短的RR1间隔通常导致异常心跳分类的概率更高。直观地，这是有道理的。

我们也可以使用部分依赖图来比较不同的模型。看着为SVM表明，它也有类似的趋势，我们随机森林相同的特征。然而，剧情更平滑，这表明SVM是方差和输入数据不敏感，使之更可解释的模型。

除了了解这些模型如何在全球范围内工作，其他情况可能会致电我们了解他们如何为个人预测工作。Lime是一种关于围绕兴趣点的数据点和模型预测的技术。从那里，它构建了一个简单的线性模型，它是我们复杂的一个近似。我们近似线性模型的系数用作确定每个特征在我们的兴趣点涉及预测的代理。

让我们来看看我们的SVM将被误解为正常的观察。我们看到，我们在此观察中的RR0的价值为0.0528。并且从我们的部分依赖性地块之前，我们注意到，在值约为0.05时，预测异常心跳的可能性下降。我们还可以看到石灰在RR0上放置高负重。RR0的高值和负加权驱动降低预测异常心跳的可能性，解释我们的错误分类。

但是，有一些局限性。Lime作为我们模型的近似，绝不是我们的模型如何工作的准确表示。为了说明这一点，我们可以看出，存在对我们复杂模型的预测不匹配的情况与近似值不匹配。为避免这种情况，请尝试使用不同的参数再次运行石灰算法，直到预测同意，例如增加要绘制的重要预测因子的数量。

我们已经证明我们如何在Matlab使用解释性技术，现在可以用解释性来比较不同的模型，揭示了数据的偏差，并明白为什么预测出问题。即使没有数据的科学背景，我们都可以运动的学习可以解释的部分，使机器。请参阅下面的链接，了解有关的任何的视频介绍的技术的更多信息。类似的解释性技术也存在于神经网络，所以请一定要看看这些资源也是如此。