通过自动化和可解释性降低人工智能采用的障碍

概述

建立良好的机器学习模型是困难和耗时的，很少有工程师和科学家有必要的经验。自动化机器学习(AutoML)将这一过程简化为几个步骤，在一个步骤中确定最佳模型并优化其超参数，从而使任何工程师都可以使用机器学习。我们还将演示MATLAB中可用的各种可解释性方法，这些方法克服了机器学习的黑盒性质，降低了在不能容忍黑盒模型的行业(包括金融和医疗应用)采用机器学习的门槛。最后，我们解释了增量学习如何使模型随着时间的推移而改进并适应不断变化的条件。

突出了

学习从原始信号或图像数据中获得优化预测模型的三个步骤
演示解释模型预测的各种可解释性方法
应用增量学习使模型适应环境的变化

主讲人简介

Bernhard Suhm是MathWorks机器学习部门的产品经理。他与客户和开发团队密切合作，解决我们机器学习相关产品的客户需求和市场趋势，主要是统计和机器学习工具箱。s manbetx 845在加入MathWorks之前，Bernhard在卡内基梅隆大学和卡尔斯鲁厄大学(德国)攻读博士学位，专门研究语音用户界面，他将分析应用于优化呼叫中心的客户服务交付。

记录日期:2020年12月15日

你好。我叫Bernhard Suhm。我是the MathWorks的统计和机器学习产品经理。欢迎参加本次网络研讨会，讨论如何通过AutoML和可解释性降低人工智能采用的障碍。

人工智能在哪些方面遇到了采用障碍?这里有几个例子。人工智能模型不像传统方法那样可解释。这家金融服务公司的数据科学团队开发了另一个基于神经网络的流动性模型，但无法向当时拒绝批准的高级利益相关者解释它是如何工作的。

模型中出现了意想不到的偏差。而[?iModel ?]的调查显示，该公司无意中对女性持卡人存在偏见。第三个例子是，长期以来人们一直期望数据驱动的方法有助于改善卫生保健的提供。这篇文章和类似的文章指出了在这一领域采用的多重障碍。例如，对无法解释的致命错误的恐惧，或者自动化被视为对现有工作的威胁。

今天我们将重点讨论这两个障碍——使用AutoML无需大量迭代调优工作和专业知识就能获得优化的模型。其次，克服对人工智能模型黑箱性质的反对。

我将通过两个例子来阐述这些挑战的万博尤文图斯解决方案——人类活动识别;以及医学领域的心电分类。虽然这篇演讲的大部分内容都集中在作为AI的机器学习上，但我将概述深度学习的类似解决方案。万博尤文图斯最后，我将介绍一些采用AI的其他障碍。

回过头来看，人工智能在许多行业的应用程度实际上是相当惊人的。下面是一些来自我们用户的例子。宝马使用各种传感器来预测车辆在哪里进入过度转向[听不清]。在制造方面，半导体公司ASML提高了硅片覆盖层的测量精度。阿特拉斯·科普柯通过使用传感器数据更新数字双胞胎，以及其他许多例子，改善了对数千个已部署压缩机的监控。

在我们深入讨论这个话题之前，让我们先澄清一下AI的含义，因为在社区中有多种概念。在最广泛的层面上，人工智能可以指任何使计算机或机器人执行通常与智能相关的任务的程序。然后，在80年代，机器学习出现了，它应用统计方法从数据中学习任务，而无需显式编程。

然后深度学习作为一种机器学习出现了，它使用了很多很多层的神经网络。今天收养的限制是什么?高德纳(Gartner)的一项研究对此进行了调查，采访了100多名高管。这就是他们得到的。

排名靠前的是不知道如何应用人工智能的员工的技能、可用的数据、范围和质量，以及对未知的恐惧，尤其是不了解人工智能的好处以及如何使用人工智能。这项研究和其他研究证实，成功采用人工智能的最大障碍是缺乏具备足够技能的员工、人工智能模型的黑盒性质以及标记数据的可用性。

今天的演讲将集中在两个最大的障碍——缺乏人工智能技能和黑盒性质。解决这些障碍的有效方万博尤文图斯案需要了解缺乏人工智能技能和更高的透明度对构建人工智能模型并将其集成到系统中的工作流程的影响。

这个图表显示了机器学习的工作流程。但是深度学习也以类似的方式受到影响，稍后我们将讨论一些细节。所以这些任务是出了名的耗时，需要大量的专业知识。

在预处理数据之后，通常需要数据科学家花费大部分时间，然后是特征工程。要获得好的特性通常需要领域知识，特别是通信、雷达信号和文本处理方面。

接下来，您需要决定在众多模型中哪一个最适合您的问题。在机器学习中有句话叫“没有免费的午餐”。即使是专家也无法判断哪种模型在特定问题下表现最好。一旦选择了模型，就需要对其超参数进行适当的调优以获得良好的性能。

随着部署的进展，您可能会意识到模型的大小太大了。因此，您可能不得不返回并选择性能特性的子集。最后，将你的模型集成到一个更大的系统中可能需要你向不熟悉AI工作方式的涉众解释模型行为。

如果你应用深度学习而不是机器学习，你本质上也面临着类似的挑战。你仍然需要调整你的深度网络的超参数。而不是优化模型，您必须在不同的网络架构之间进行选择。尽管深度学习已经被认为不需要特征，至少对于信号和文本应用程序来说，某种形式的数据约简对于良好的性能至关重要。

我们将在两个应用程序的背景下演示我们的解决方万博尤文图斯案，并从这里的数字健康开始——基于ECG数据对心脏状况进行分类的任务。心电信号的典型特征是所谓的QRS波。这是心脏信号中的一个大峰值。这个信号导致心肌剧烈收缩并将富氧血液推入所有动脉。这需要大量的能量。

这里的其他方式与将缺氧血液转移到肺部有关。但专家们关注的是这些大R峰值之间的距离，即所谓的R-R间隔。这就是你所需要记住的，以便能够了解我们将设计什么类型的功能。

因此，我们降低构建人工智能模型所需技能的第一个解决方案是交互式地构建模型，就像这里所示的所谓的分类学习者应用程序，它允许你点击一个按钮，比较许多不同流行模型的性能，使用不同的指标评估准确性，然后甚至交互式地调整它们的超参数。

但我们不讨论它了，让我们在MATLAB中看看。让我们更详细地讨论我们可以为这个任务使用什么样的特性。当然，你们没有医学知识，但我提到过这些R峰之间的距离很重要，R-R区间。

我们来看三个连续的这样的间隔。我不仅要看它们发生的有多快，还要看它们的比率，第一个和第二个的比率，第三个和第二个的比率。我不会告诉你们如何计算这些特征。相反，我们将把它们预先计算到工作区中。但你可以在这里RR0 RR1 RR2，然后是比率。

接下来，我们将在分类学习器中交互式地构建两个模型。你可以在Apps选项卡上找到它。加载数据之后，我已经构建了两个模型——一个查找决策树和逻辑回归，这是两个类问题的一个很好的基础模型。但是你可以看到它的准确度要低得多。

支持向量万博1manbetx机也没有高多少。让我们试试另一个模型，比如中等树。它的表现明显更好。最后，让我们尝试一个树木或随机森林的样本。

这似乎表现最好。这是我们稍后要分析的。为此，我将把它作为变量导出到工作区。这应该让您了解了构建几个模型并比较它们的性能是多么容易。

但是AutoML添加了什么呢?这是我们的工作流程，所有这些复杂的，你刚刚尝到了一些。嗯，AutoML的思想，至少在理论上，是消除所有这些复杂性，理想情况下，从分类问题中的预处理数据直接到优化的模型，并准备部署到您的系统中。目前市场上没有AutoML解决方案能接近这一理想目标。

然而，在MathWorks，我们已经为工程应用开发了AutoML的一个版本。这是我们的工作流程。作为解决特征工程问题的第一步，我们依靠我们在小波方面的经验。它们非常擅长匹配现实世界信号中的峰值和不规则性。你可能不太了解小波，但这并不妨碍你应用这些技术。

其次，由于通常会生成数百个小波特征(对于小型模型来说太多了)，因此需要选择性能特征的子集。MATLAB支持许多自动特征选择方法。万博1manbetx最后，在关键，模型选择与超参数优化内置。我们有一个单步函数来完成这些目标，并交付一个优化的模型。

让我们更详细地看看这三个步骤。首先，小波散射特征生成。你可能想知道什么是小波。它们帮助我们把信号分解成更小的部分。如果你知道傅里叶分析，它把信号组成它们的窦分量。类似地，小波将信号分解成它们的小波分量。

然而，小波在时间上是非常有限的，它们可以在宽度上变化。所以它们非常适合匹配信号中的小不规则，就像这个动画中提到的那样。

小波散射将一个复杂信号分解成不同的小波分量。这样做的好处是你不需要知道是什么样的小波。这是自动完成的。

然后特征也会被计算出来。有些人将其与深度网络最初的做法进行比较。他们把图像分解成不同的组成部分。小波散射的优势在于，与深度网络不同，您不需要数百万个数据示例。这对信号和图像数据都适用。

下一步，在AutoML语音特征选择中，有许多方法可用。在这里，我只强调一些。NCA在分类回归中工作得很好。不过，最近，我们添加了MRMR，即特征的最小冗余最大相关性，它计算非常快，与模型无关，并提供了一组强大的特征。如果你有一个高维特征空间，并且正在寻找快速计算，我们最近添加的这两个单变量方法可能会帮助你。

第三，让我们更好地理解带超参数调优的同时模型优化。在接下来的动画中，您可以看到评估不同模型类型的优化。在幕后，还有许多不同类型的参数组件，所以这里蓝色部分的错误率会随着时间的推移而降低并收敛到最小值。

为了提高这个过程的效率，我们使用了在过去的版本中应用于超参数调优的贝叶斯优化技术。这使我们能够有效地转移这个大空间的模型和超参数组件，并限制计算时间。然而，说实话，它在计算上仍然是昂贵的。因此，您需要在更大的数据集上采用并行化。AutoML函数支持并行计算。万博1manbetx

我们将在人类活动识别任务中演示AutoML，其中来自手机加速度计的传感器数据被捕获，然后对您当前正在进行的活动类型进行分类——行走、站立、躺着。首先，我们将加载这些原始数据，并将其可视化为我们所谓的堆叠图，这样您就可以从X、Y和Z看到加速度计。

这里我选了一段活动从走到坐的部分。你可以看到明显的不同。所以你可能会想，什么样的特征会捕捉到这种变化。但相反，我们在AutoML中应用小波散射作为第一步，首先使用这个函数定义小波框架，这个函数只有信号长度和采样频率作为输入。

然后对未缓冲的列车数据和原始测试数据进行小波散射处理。我看这里，它计算了将近500个小波特征。对于一个小模型来说太多了。

第二步，在AutoML中，我们应用自动特征选择，这里是FS MRMR函数，它代表计算特征的最小冗余最大相关性。它会对超过500个特征进行排序只显示前50个特征。接下来是排名。你可以看到分数是如何快速下降的，但随后出现了一个长尾。

因此，为了得到一个更紧凑的模型，我们只选择了前25个特征。然后，作为AutoML的第三步，也就是核心步骤，我们将模型选择和调优函数fitcauto应用于AutoML。让我们开始吧。

你可以确定各种参数。我们将迭代次数限制在50次。所以它很快就会结束。这里它开始计算第一对模型和超参数组合。你可以看到一个k近邻模型，支持向量机树，判别分析。这里你可以看到误差图是如何开始向较低的值收敛的。

你可能想知道这到底有多管用?我们比较了AutoML，正如你刚刚在MATLAB中看到的那样，首先手动确定要使用哪些特征，然后尝试许多不同的模型并手动优化超参数。

首先，我们看一下刚刚演示的人类识别测试。我们还将其与心音分类进行比较，你将心音录音的录音图分为正常和异常。这就是结果。

AutoML匹配模型的性能，在这些模型中，有机器学习知识的人试图应用交易技巧并优化模型性能。AutoML的重点不在于它将击败人工优化过程，而是在不需要复杂和耗时的模型构建过程的情况下获得一个达到相当精度的模型，这是一个巨大的胜利。

让我们继续讨论采用AI的第二个障碍，即模型的黑盒性质。理想情况下，我们有可解释且高度精确的可用模型。但这张图表显示，在可解释性和预测能力之间存在权衡。

有很容易解释的模型，比如决策树，逻辑回归，线性模型。但它们的性能比不上更复杂的模型，比如树、支持向量机和深度学习网络。因此，需要可解释性来克服这种黑盒性质。

但更具体地说，至少在某些行业，你有监管要求，比如金融业。或者在欧洲，有GDPR。对于医疗设备，美国的食品和药物管理局有相关规定。

最后，数据科学家，为了改进模型，他们喜欢更详细地了解它们是如何工作的。所以帮助他们找回可解释性是有帮助的。我使用了可解释性——更具体地说，它指的是大多数传统机器学习中模型决策的因果关系。然而，我看到可解释的AI主要用于深度神经网络的可视化激活。

让我们更好地理解哪些监管需求需要可解释性。我已经提到了金融行业。在这里，信用和市场风险模型确实需要解释。一个原因是用于这些用例的传统模型是非常可解释的。这就是包括高级管理层和监管机构在内的利益相关者所期待的。

有典型的复杂模型，在金融领域非常流行，有树的梯度，还有一些深度神经网络。作为可解释性的方法，Shapely非常受欢迎。几分钟后你就会明白为什么。

相比之下，在汽车和航空行业，你需要满足安全认证的要求。深度神经网络用于图像识别，强化学习用于绘制路径。实际的法规尚未最终确定，但MathWorks在ISO 262626或飞行法规(例如DO-178)的车辆安全关键应用方面拥有丰富的经验。这里提到的这两个机构目前正致力于发布类似的人工智能指南。MathWorks参与了其中一些对话。

作为第三产业，至少某些类别的医疗器械需要获得医疗监管部门的批准。深度神经网络也用于图像分析，也用于经典的机器学习。这里的景观还没有进化到这样的程度。

如果你在一个对可解释性有特定要求的不同行业工作，我们很乐意听到你的消息。我在这里提到了一些流行的可解释性方法。让我来帮助您了解哪些可解释性方法可用，以及何时使用它们。

所以在这个过程的开始，你可能会问自己一个问题，可解释的方法是否为我的问题提供了足够的准确性?然后，你可以使用那些固有的解释，比如线性模型和gam的权重，或者贝叶斯模型的分支、决策树和后置。

如果这些简单的模型不够准确，那么您需要考虑更复杂的模型。但下一个问题是，我需要只解释局部行为吗?如果是这样的话，有LIME和Shapely可供选择。

区别在于你是否需要一个完整的解释。而只有莎菲利提供了一个完整的解释，所有因素的贡献。这就是金融监管所要求的。这就是为什么Shapley在这个行业很受欢迎。然而，如果你正在寻找一个全局的解释，特征重要性和部分依赖图是可以使用的方法。

LIME代表局部可解释模型不可知解释。真拗口。但本质上，这是一个相当简单的方法。我们近似一个复杂的模型，如图所示，在这个复杂的决策边界上有蓝点和绿点。

我们并不是处处近似，而是在黄色区域的兴趣点附近。为了做到这一点，你在这附近选择了两个类的一些标记点然后用它们建立一个简单的模型，就像这个例子中的线性模型一样。然后你可以利用这个简单模型的固有消耗性为复杂模型提供一个近似值。在这个例子中，这些不同因素的权重可以解释这个区域的复杂行为。

我们不讨论它，而是看另一个演示。我们回到第一个ECG分类的例子。因为要应用模型可解释性，您需要利用应用程序领域的知识或数据来预测模型应该如何表现。相比之下，对于我们在人类活动识别示例中自动生成的小波特征，很难得出这样的期望。

好的，记住，在我们训练几个模型之前其中有一个中等决策树。验证模型的一种方法是利用其固有的消耗性。对于树来说，就是树枝。这里我们展示了这个模型的树分支。

您可以看到，该决策考虑了这些RR值。如果它们足够小，你就向左，再向左，再向左。然后你的心脏就不正常了。这很有道理。

如果间隔非常小，心跳就会非常快。所以这可能是个不好的迹象。但要详细分析这些数据是很麻烦的。那么让我们看看其他可解释性方法——全局方法。

我们可以看看复杂袋装树或随机森林的特征重要性。这告诉我们哪些是重要的特征。这里我们画出来。你可以看到，这些RR，是最合理的三个。

然后我们有这些振幅。我们会稍微讲一下然后再讲比率。一种观察全局的方法是偏依赖图。我们来计算其中一个RR比率。

正如你在这张图中看到的，心脏异常的可能性在0.05之后急剧下降。这就意味着，如果这些尖刺非常接近，心脏就会跳得很快。这很可能不正常。否则，没关系。

然后我们看到其他RR值也有类似的情况。现在，让我们看看比率。在这里，我们为这两个比例中的任意一个绘制了相同的偏依赖图。如果我们看比率，接近1的比率，就像这里，意味着后面的R峰有相同的距离。这意味着正常。

但如果它们的距离不一样，比如这些高值，那很可能是心律不齐。这是一个不好的信号。这就是可能性上升的原因。

在看了一些全局可解释性方法之后，让我们看一些局部可解释性方法。这是一个特别的兴趣点。应用这个理论的一个例子是理解模型什么时候出了问题，发生了什么。

所以让我们看看这里的一些预测，挑出那些模型出错的地方。我们将通过找到错误的，然后开始准备应用LIME来做到这一点。然后在这里我们把LIME对象放到第二个错误的预测上。

我们在这里看到了什么?这里，我们看到了这一点的LIME模型。我们看到，RR比率在预测中扮演着重要的角色。这很有道理，没什么好奇怪的。那么为什么会出问题呢?

我们可以看到RR1和RR2的值，它们仍然有很高的权重，远高于0.05。所以它们在正常心脏的范围内。这就是为什么在这个地方，模型预测心脏状况正常，即使它实际上是不正常的。这是一个如何使用局部模型可解释性来理解模型何时在预测中出错的例子。

现在你已经很好地理解了机器学习的可解释性，让我们来看看深度学习。在那里，它主要意味着解释为什么深层网络做出某些决定。

举个例子。这张马克杯的图片被误认为是扣带。现在你可以看看可解释性了。深度网络查看了图像的哪些部分——关注的是扣环而不是杯子?所以这给了你一个暗示，在你的训练数据中很可能仍然存在偏差。

解决这个问题的一种方法是增加马克杯的训练例子，其中没有手和扣。有很多方法可以做类似的分析，包括遮挡灵敏度和GradCam和Image LIME。

所以我花了相当多的时间谈论采用AI的两个挑战——缺乏AI技能和模型的黑盒性质。让我通过谈论一些其他的挑战来结束今天的网络研讨会。

如果您还记得，模型构建工作流是从预处理数据开始的。对于数字数据的感觉，MATLAB提供了交互式工具来解决原始数据的常见问题，例如填充缺失数据，识别异常值，平滑数据。所以我们有实时任务可以交互地完成。

接下来在工作流中，对于监督学习来说，拥有足够的劳动数据是一个巨大的挑战。专门的标签工具可以提供帮助，特别是如果它们提供了通过应用初始AI模型来获得粗略标签来自动化一些标签的选项，这样人工注释人员只需审查和偶尔更正这些标签草稿，例如在信号和图像处理工具箱中可用的信号图像和视频标签应用程序中。

一旦你训练了一个性能模型，你就有可能需要将它与一个更大的系统集成。仿真环境如Simulink和基于模型的设计被用于许多行业，以促万博1manbetx进系统集成和测试。最后，一旦部署了模型，就必须监视它的性能，并且可能至少需要偶尔更新它。我们支持一些机万博1manbetx器学习模型和模型更新的增量学习，这些模型部署模型时不需要重新生成代码。

让我对最后一点再展开一点。一旦您有了准备部署的性能初始模型，自动代码生成就可以将高级MATLAB转换为低级CC++代码，然后可以在硬件上执行并嵌入到更大的系统中。一旦部署了系统，您通常会收集数据，并且可以使用这些数据来改进您的模型，可以应用增量学习，也可以在MATLAB中重新训练整个模型。

现在关键的一点来了。当您移动模型时，更新到您的生产系统中。您希望避免更新部署的代码，避免不得不一遍又一遍地执行认证过程。相反，您只需使用通信机制(如空中通信)将更新的模型参数传递到部署的系统中。此工作流的一个不同用例是在具有不同模型配置的复杂系统的循环中执行软件和硬件测试。

总之，今天，我已经演示了MATLAB如何降低采用人工智能的障碍，特别是机器学习。我已经花了相当多的时间来讨论如何以交互方式轻松地构建模型，或者通过领导AutoML，这样没有专业知识的工程师和领域专家就可以自己构建模型，甚至有经验的从业者也可以更高效地构建模型。

我刚刚提到了促进嵌入式部署和与Simulink集成的代码生成，而新的本机机器学习块库使之变得更加容易。万博1manbetx类似地，对于深度学习，可以在Simulink模型中集成这些模块。万博1manbetx

如果你想了解更多关于我所谈论的内容，分类学习器，作为一个交互式工具的例子，它使构建模型变得更容易，或者一个关于AutoML的视频，通过三个简单的步骤，你可以得到优化的模型，以及如何应用不同的模型可解释性方法。回到基础，我们还有两个小时的入门课程，帮助你熟悉MATLAB中的机器学习，并链接到我在这次演示中提到的演示。

我的演讲大部分都提到了机器学习，但类似的工具也可用于深度学习。要了解更多信息，请参考这些资源——介绍视频和交互式深度网络设计器应用程序，举例说明各种可视化技术来解释深度神经网络的行为，使用实验管理器进行深度学习自动调整超参数，以及两个小时的深度学习入口。

你可以在mathworks.com上找到这些资源。例如，从机器和深度学习的页面解决方案开始。URL显示在这里。您还可以要求免费试用统计和机器学习工具箱和深度学习工具箱，这取决于您正在应用哪种类型的AI模型。这次网络研讨会到此结束。非常感谢您的兴趣。