MATLAB中的模型解释性

爱马仕苏宁，马努工

可解释的机器学习（或深入学习，“解释为AI”）提供了克服AI模型的黑匣子性质的技术和算法。通过揭示各种功能如何贡献（或不贡献）预测，您可以验证该模型正在使用正确的证据，以便其预测，并揭示培训期间不明显的模型偏差。

概述模型解释性和IT地址的用例。对于有兴趣采用机器学习但疲惫不堪的黑匣子型号的工程师和科学家，我们解释了可解释性如何满足法规，在机器学习中建立信任，并验证该模型正在运行。这在融资和医疗设备等行业中尤为重要，规定设定严格的指导。我们概述了机器学习的可解释方法以及如何在Matlab®中应用它们。我们证明了在医学应用的背景下的可解释性，基于ECG信号进行分类心脏心律失常。

近年来，我们在许多智能任务中看到了AI和机器学习算法超越或匹配人类性能，例如医学成像诊断和操作机动车。然而，这些成就的核心缺失是对这些算法如何工作的直观理解。

这个视频解释了为什么可解释性很重要，有哪些方法可以解释，并演示了如何在Matlab中使用这些技术。具体来说，我们将研究LIME、部分相关图和排列预测器重要性算法。我们将在心电图分类的背景下检查可解释性。所描述的技术可以应用于任何模型。这段视频不需要医学背景。

为什么我们需要解释性？要开始，机器学习模型并不直接了解，并且更准确的模型通常不太可解释。此外，需要可解释性方法来帮助在医疗，金融和安全行业中导航监管障碍。

还需要可解释的模型来确保他们使用正确的证据并揭示培训数据中的偏见。最近对AI的灾难性使用是信用卡评分，其中据报道，算法对女性的男性提供了更高的信用限制。这可能是由于训练数据中的偏差，实时数据中的偏见，或其他东西。解释模型有助于我们防止这些问题。

对于我们的示例，您将对培训的机器学习模型应用可解释性，以将心跳分类为基于来自两个公开可用数据库的ECG数据的异常或正常。ECG代表了心脏对窦票据的电刺激的反应，并且通常分解成QRS方式。我们将使用Matlab的小波工具箱从原始信号数据自动提取QR波的位置。从那里，我们从R-Peaks中提取了八个功能以用于培训。

一旦我们有了特征，我们就可以使用分类学习器快速训练模型。在这里，我们训练了一个决策树作为一个固有可解释模型的例子，以及两个复杂的模型。如果精确度是最重要的，那么它只会选择性能最好的模型。然而，在一些情况下，如预测生命终点护理，可解释性是非常重要的。我们要确保模型使用正确的证据进行预测，也要了解模型可能出错的情况。

使用MATLAB置换的预测函数，我们看到，对于我们最好的执行模型，随机森林，R波的幅度被包括为重要的预测因子。然后，我们可以使用Matlab的部分家属图来量化R幅度对模型输出的影响。我们看到，随着振幅接近0，这有助于输出异常心跳分类的可能性5％的变化。

但是，这与我们的域名知识相矛盾。专家表示，R幅度级别对心跳的分类几乎没有影响。我们希望确保数据中的这些偏差不包括在我们的模型中。所以接下来，我们恢复了我们没有幅度的模型作为预测因子。一旦我们删除了偏见，我们就可以看到我们的新决策树如何在全球范围内工作。该树代表RR0和RR2间隔的RR0和RR2间隔将成为最重要的预测因子而不是关注R型幅度。

对于更复杂的模型，如我们的随机森林，我们再次使用部分依赖性地块，了解我们最重要的预测因子如何影响模型。我们看到极度短的RR1间隔通常导致异常心跳分类的概率更高。直观地，这是有道理的。

我们还可以使用部分依赖性图来比较不同的模型。查看SVM的相同功能表明它具有与我们随机林有类似的趋势。然而，绘图要更光滑，表明SVM对方差和输入数据的敏感性不太敏感，使其成为一种更可解释的模型。

除了了解这些模型如何在全球范围内工作，其他情况可能会致电我们了解他们如何为个人预测工作。Lime是一种关于围绕兴趣点的数据点和模型预测的技术。从那里，它构建了一个简单的线性模型，它是我们复杂的一个近似。我们近似线性模型的系数用作确定每个特征在我们的兴趣点涉及预测的代理。

让我们来看看我们的SVM将被误解为正常的观察。我们看到，我们在此观察中的RR0的价值为0.0528。并且从我们的部分依赖性地块之前，我们注意到，在值约为0.05时，预测异常心跳的可能性下降。我们还可以看到石灰在RR0上放置高负重。RR0的高值和负加权驱动降低预测异常心跳的可能性，解释我们的错误分类。

但是，有一些局限性。Lime作为我们模型的近似，绝不是我们的模型如何工作的准确表示。为了说明这一点，我们可以看出，存在对我们复杂模型的预测不匹配的情况与近似值不匹配。为避免这种情况，请尝试使用不同的参数再次运行石灰算法，直到预测同意，例如增加要绘制的重要预测因子的数量。

我们已经证明了我们如何在MATLAB中使用可口译性技术，现在可以使用可解释性来比较不同的模型，揭示数据偏见，并理解为什么预测出错。即使没有数据科学背景，我们也可以成为使机器学习解释的运动的一部分。有关在视频中引入的任何技术的详细信息，请参阅下面的链接。神经网络也存在类似的可解释性技术，因此请务必查看这些资源。