詹姆斯马丁,壳牌国际
Amjad Chaudry,壳牌国际公司
机器学习和深度学习可以用来实现一系列任务的自动化。壳牌和先进分析中心(AACoE)正在使用这些技术来加快处理速度,同时提高可靠性。在地貌学中,可以利用标记卫星图像的丰富训练数据集来改进地形分类。在大型(全景)植物图像中的自动标记检测也导致更有效的维护。
詹姆斯和阿姆贾德将展示如何MATLAB®让这些技巧变得简单。通过最小的设置,MATLAB Parallel Server™允许团队在云中的多个远程gpu上训练网络。MATLAB Production Server™允许团队创建瘦web客户端,该领域的操作人员可以使用最少的物理硬件(如智能手机)。
壳牌充分利用了所有这些技术和工具,使其工程师能够轻松、毫无痛苦地使用最新的发现。
记录:2018年10月3日
在过去四年左右的时间里,高级分析在我们的工作方式中扮演着越来越重要的角色。今天,我想特别向大家介绍一下深度学习,以及在MATLAB中,我们如何利用一些深度学习工具来改进我们的创新管道。有趣的是,Rick的主题演讲提到了迁移学习和语义分割。这就是我今天要讲的一些例子。
当然,作为壳牌,我们总是要提出警告。所以我把这个问题留到5秒钟左右给那些想要阅读的人。好。
今天,我将按照以下方式来组织我的演讲。我将简要地向大家介绍一下Shell以及我们所提供的服务和产品。s manbetx 845我还会讲到我们的创新和交付渠道,我们如何尝试并将创新理念,尤其是在高级分析中,引入到最终产品中,这些最终产品是由IT来维护的。s manbetx 845然后用MATLAB算一下。
然后我会谈谈两个用例。正如我所提到的,第一个在工业图像标签识别,然后也地形超光谱卫星图像识别。这听起来非常酷,所以我把它放在那里。然后终于下一步,我们从哪里里去的结果,我们已经有了。
好的。所以,这是我们的业务总结幻灯片的最新体现。所以我们是一家涉及面很广的公司。我们的业务范围从我最初加入该公司开始一直到现在,当时该公司处于上游勘探阶段,试图识别碳氢化合物矿床。然后通过发展我们尝试和钻井中提取,然后通过更多的下游活动,我们试着流程和改进产品,通过运输和交易,然后我们提供这些产品的各种终端用户,其中可能包括零售前院,航空、润滑剂。s manbetx 845
如果我们重新利用这些信息,我们就可以突出分析在组织中带来的价值。哦,就是这样,我真正想要引起大家注意的是所有这些不同颜色的圆圈。所以这些都是活跃的领域,分析在我们的组织中发挥着主导作用。我们最终可能会有相当大的改变,对当前的工作流程和工作方式产生相当大的影响。蓝色的两个圆圈是我要进一步研究的地方。
黄色的是我们的创新漏斗。上面有一系列的决策门,从D0到D4。基本上我们试着把想法和概念从左到右。
在底部你可以看到两个重叠的三角形我们有一个重叠的地方——我们从一个数字化团队,也就是我现在坐的地方,移动到正确的地方。所以
我们尝试和做的是在确定范围和创新阶段,我们参与。我们生产的POC概念,最小可行的产品,尝试和证明的价值。s manbetx 845然后逐渐地,它被引入,我们尝试并确定出完整的部署解决方案和维护策略,这样我们就可以完全地向业务交付价值。万博 尤文图斯
我想引起大家注意的另一件事是所有的点。所以它——把它想成是组织左边的想法数量的一个标准指标。我想强调的是,我们完全可以接受每个决策门都有大量的变动,所以要确保你在组织中有充分的范围。当你走到最后,我们把你的资源,集中在最具价值的解决方案上。万博 尤文图斯
MATLAB在哪里增值?这是一个非常快的原型。我们与MathWorks Consulting有一个积极的协议,我们利用它来提高我们的生产力。
有大量的例子和文档,我们想在MATLAB中维护它们。由于MathWorks将重点放在集成一些深度学习技术上,比如在去年,我们能够利用该领域的一些最新发展,同时也能够访问这些有利的积压模块。我们非常喜欢web应用程序交付,所以我们绕过了安装MATLAB版本来运行我们的一些软件的许多问题。
这里我们有两个我们制作的网络应用的例子。右上角是一个沥青测试的网络应用程序。在左下角你还可以看到我后面会讲到的一个预览,那就是地形分类作为一个网络应用。
我们也一直在尝试了一下与MDCS,所以MATLAB分布式计算服务器。所以,让我们对云计算的杠杆作用相当强大的GPU。我们主要用它训练了我们的一些深层的学习模式。
就今年而言,我们已经在Shell和MATLAB之间取得了一些里程碑式的进展。现在我们终于——因为Shell有时会有一些管理方面的事情,要为业务的不同部分获得许可是相当困难的。所以现在我们有了一个企业范围的交易。这意味着任何聪明的人,不管他们来自哪里加入这个组织,从理论上讲,最终都能很快地用MATLAB提高效率。
我们有第二个MPS许可证。正如我所说,我认为,MDCS将成为一个越来越重要的特征。我们正在考虑使其更符合我们的战略。
正如我所说,MathWorks咨询公司非常有效地利用了我们的时间。现在我们也希望利用我们在班加罗尔的一些资源让我们能够夜以继日地推进项目。
好的。这是第一个例子。这就是标签识别。你在背景中看到的是一个工业设备。我想是打气筒。
但骨子里,我想提请你注意,是标签,该标签。这标签上有一个SAP代码。而我们这些图像都点缀around--他们都geotagged--在工业环境中的所有点左右。我们想要做的是提取物,标签,这样做就可以了OCR,然后链接,通过我们的SAP系统,因为我们可以从SAP系统将大量的元数据。
我们最初采用的方法是使用R-CNN,一种区域卷积神经网络。我们取图像。然后,由于图像非常大,我们需要首先从图像中提取一系列的区域建议,然后将其输入到CNN中。
在我们的例子中,我们用。我想Rick讲过AlexNet的例子。所以我们使用了VGD 16网络,然后为了达到我们的目的,我们在最后三层进行了迁移学习。首先我们有两个类问题。我们只有标签或者没有标签。
这是一些图片的样子。想想谷歌的街景。所以在左边你可以看到它几乎就像是用鱼眼镜头拍摄的。首先我们需要对图像进行失真校正,这是在MATLAB中完成的。然后想一下,它的输出几乎就像你站在一个盒子里,然后你有盒子的六个面朝外。
我们把上面和下面的投影都去掉,只保留水平的前投影。然后我们把它输入到算法的区域提取部分。在本例中,我们稍微修改了它,并使用了Pdollar EdgeBox方法。但重要的是,你可以看到区域很好地提取了可能有标签的区域。
好的。这则得到通过对CNN喂养。所以这是现在只是在讨论的训练。
因此,尽管与训练你不需要太多的训练数据,但是,我们仍然有一些问题想有足够的训练数据集用于这以稳定的方式进行。所以,我们种的扩大标签的定义更多的标志。所以,我们还包括标志,然后做数据扩张,以进一步提高数据集,以提供足够的数据给你一个稳定的结果。
在右边你可以看到训练后的激活。这很好地说明了在分类之前网络最初关注的地方。这个看起来很奇怪的图像告诉你它实际上聚焦在紫色的斑块上。这是算法的输出。
所以,你可以看到一个室内场景,你可以看到一个外景,不同的光照条件。而你得到的是围绕它认为边框是signs-- sorry--哪些标志和标签与相关联的概率。
对于你们之中敏锐的眼睛,你可能会注意到,有很多误报在那里。而我们要做的是真正实现了所有可能的选项,然后,我们需要依靠OCR在此之上,以过滤掉大量的误报。
好的。我刚刚向你们展示了转移学习被用来识别工业图像中的标签,然后在上面运行OCR来提取SAP代码。在运行时方面,只是给你一个概念,每幅图大约3到4分钟。现在在这个特殊的用例中,我们可以处理它,那很好,但显然如果你想要实时反馈,那是不会发生的。
然而,如果你想沿着实时路线走下去,有一些技术可以显著提高速度。举个例子,快速的R-CNNs,它的速度可以提高100倍。
我们也在寻找可能获得更多的GPU,GPU的大的MDCS,让我们增加图像的分辨率大小。而接下来,我想,很酷的事情是,一旦我们连接这通过对SAP系统,我们怎么然后将这些信息反馈,比方说,有人行走在工地附近的一些增强现实眼镜?我们怎样才能共同想象这些信息?这可能是我们的一些客户感兴趣的是一个相当令人兴奋的领域。
所以我们使用的数据来自欧洲的一个工业站点,我们现在有很多兴趣,特别是来自亚洲的一个商业单位。所以我们要继续这些活动。
好的。下一个例子是高光谱卫星数据中的地形识别。快速描述一下为什么这个问题值得解决,为什么我们要这么做。
因此,在上游勘探,地震数据是最重要的技术之一,我们必须为了看在地下地面下方。并且,例如,在底部未指定这个中东地区的位置,你可以看到它的辽阔,对不对?而采集数据,因此把精力投入到地面,并接受它的成本是非常高的。所以,我们正在谈论数百万每年,每调查。这是非常高的成本。
而地形类型,例如,平滑与粗糙,会影响高达50%的成本。正因为如此,在我们的语言中,他们有一个非常理想的情况来标记数据,但在他们的语言中,这是一个非常低效的系统。所以他们花钱请一个高度专业的,高薪的个人来查看卫星图像,并在粗糙的地形周围手工绘制多边形,他们认为这是粗糙的地形。
然后他们必须通过实地考察来证实这一点。所以必须有人飞到这个沙漠的特定区域,然后开着卡车到处跑。他们需要放下旗帜来确认这确实是一个崎岖的地形。这是在调查之前。
在我们的例子中,因为我们现在有很多训练数据,我们认为。也许我们可以用一些更需要计算机的东西来代替整个工作流程。所以我们决定尝试这种语义分割方法。
这就是我们得到的数据。我们有三种类型的图像,航空摄影,雷达,和深度表面模型,DSM图像。由于2017年B的限制,我们需要做三个渠道,但在这种情况下是可以的。
这在2018年的A和b中得到了改进,但我们决定将其分为三个通道来给图片上色,我们的做法如下。我们将航空照片进行了灰化处理,将其置于红色通道中,雷达置于绿色通道中,等等。最后你会看到这些彩色的图像,你们可以在右边看到。这是用于算法的。
SegNet是什么?它通常用于自动驾驶汽车。想象一下左上角的道路场景,网络做的是你输入它,然后它会把每个像素映射到一个类。
在顶部的例子中,你有一个人行道类,一个道路类,一个树类,等等。所以在我们的例子中,我们想要重新使用这个并将它用于粗糙地形或平滑地形。这就是我们所做的。
事实上,我们目前所面对的30,000例的数据集,但是我们只是为这项工作,使用1000倍的例子。所以有很多改进的余地。而且我们也与在上面的图片,有网络的稍微简单的结构。
所以我们决定使用三个编码器和解码器部分。对于1000个测试样本的训练,在一个4g的GPU上,这是相当小的,大约需要8小时的训练时间。
这些就是结果。我去掉了颜色,把它分解成原始的图像。在顶部你可以看到,在左边,航空摄影,然后是雷达和DSM。然后在左下方,你可以看到人,或者在我们的例子中,地面的真相,然后是算法预测的结果。
而在这两种情况下,你可以看到,OK。对于这个选择,我选择了数据的快照,其性能是相当不错的。目前的结果是小定性而不是定量的,虽然我们将要努力生产混淆矩阵,所有这些事情。但是,性能非常不错。而我们发现这,实际上,终端客户,并已基本上他们认为性能优于现有的工作流程。
我们允许客户通过一个web应用程序的数据交互,所以这是你可以在这里看到。随着左边的图片,客户可以很容易刚进入网址,只是上传的各种图像加上感兴趣的领域,他们想看看。然后在推理步骤后的权利,你可以通过不同的输入和输出图像轻弹和覆盖地面的真理,只是让他们能得到什么样的结果意味着感,他们很高兴有和他们”再不满意。
好的。所以在接下来的步骤中,这很像初始工作。所以未来还有很多工作要做,假设我们能从内部得到足够的资金。我们要做的第一步是参数调优。
我们要开始增加训练数据的数量从我们现在的位置开始,也就是1000。我们还会添加更多的类。我们有一个设施类,一个城市类,我们想要添加到数据中。你可以在右上方看到一个工具类的例子。
这个应用程序也是,我们只是很快地——只花了两天就完成了那个网络应用程序。这就是与MathWorks Consulting适当合作的真正力量。我们希望在web应用程序中添加更多的功能,并准确地交付客户想要的东西。
在这个特殊的例子中,因为已经有了性能,人们对此非常兴奋,所以有一点担心这将如何影响现有的工作流程。这包括工作人员。所以这次我们试图dual-integration策略,我们都提供这项技术同时也技能提升员工,这样他们就可以了解工作流程,了解这项技术,然后还可能想出新的想法和更好的工作方式,然后我们可以想出。我们在中东的一些单位显然对这项技术很感兴趣。但我们现在也收到了一些东南亚业务部门的兴趣。
那么,这对未来意味着什么呢?在Shell中,最重要的是了解总体规划,然后了解如何适应总体规划。在我们的案例中,我们有这些数字主题。
所以我们现在要确保我们在内部推广的方式与这些数字主题一致,我们已经确定了其中的三个。利用一切到云,高性能计算与MDCS,然后先进的分析。例如,基于智能应用程序的技术。
就2018年当前优先事项而言,我们希望继续部署MPS和MDCS。现在我们已经证明了其中一些解决方案的技术方面,但是我们现在需要看看证明业务价值方面。万博 尤文图斯正如我所说,我们将进一步研究地形识别,标签识别。
但不幸的是,我今天不能讲的东西,也属于地震范畴。所以我们目前正在研究非常陡峭的技术来尝试绘制地震数据,仅仅是地下的图像通过简单的卷积就可以得到油气分布,碳氢化合物分布,碳氢化合物属性分布。因此,这是一个非常令人兴奋的领域,我们公司有相当一部分人也在关注这个领域。
好的。这就是我要说的。我希望这是一次有趣的谈话。谢谢你!
你也可以从以下列表中选择一个网站:
选择最佳的网站性能的中国网站(在中国或英文)。其他MathWorks的国家网站都没有从您的位置访问进行了优化。