詹姆斯·马丁,壳牌国际
壳牌国际公司Amjad Chaudry
机器学习和深度学习可用于自动化一系列任务。壳牌和高级分析卓越中心(AACoE)正在使用这些技术来加快流程,同时提高其可靠性。在地理信息学中,可以使用标记卫星图像的丰富训练数据集来改进地形分类。大型(全景)植物图像中的自动标签检测也可以提高维护效率。
James和Amjad将演示如何使用MATLAB®使使用这些技术变得容易。通过最少的设置,MATLAB并行服务器™ 允许团队在云中的多个远程GPU上训练网络。MATLAB生产服务器™ 使团队能够使用最少的物理硬件(如智能手机)创建现场操作员可以使用的瘦web客户端。
壳牌利用所有这些技术和工具,使其工程师能够轻松、无痛地使用最新发现。
记录日期:2018年10月3日
在过去四年左右的时间里,高级分析在我们做事的过程中扮演着越来越重要的角色。不过,今天我想特别跟大家谈谈深度学习,特别是在MATLAB中,我们如何利用一些深度学习工具来改进我们的创新管道。有趣的是,Rick的主题演讲提到了迁移学习和语义分割。这正是我今天要和你们讨论的一些例子。
当然,作为壳牌公司,我们总是要提出警告。所以我会把这个留给那些想阅读的人五秒钟左右。好啊
所以今天,我将把我的演讲安排如下。我将向您简要介绍壳牌公司以及我们提供的一系列服务和产品。我还将讨论我们的创新和交付渠道,以及我们如何尝试将创新理念,特别是在高级分析方面,通过IT部门正确维护的最终产品引入创新。然后MATLAB就可以融入其中了。s manbetx 845
然后我将讨论两个用例。正如我提到的,第一个是工业图像中的标签识别,然后是高光谱卫星图像中的地形识别。听起来很酷,所以我把它放在里面了。最后是下一步,我们将从那里得到我们已经得到的结果。
好啊因此,这是我们业务总结幻灯片的最新体现。所以我们是一家范围非常广泛的公司。从我最初加入该公司开始,我们一直致力于上游勘探,试图识别油气矿床。然后是开发阶段,我们尝试打井开采这些产品,然后是下游活动阶段,我们尝试加工和提炼产品,然后是运输和贸易阶段,我们将这些产品交付给各个终端用户,包括零售前院、航空和润滑油。s manbetx 845
如果我们重新调整这些信息的用途,我们就可以突出分析在组织内部带来的价值。而且--哦,就是这样--我真的想让大家注意的是各种颜色的圆圈。因此,这些都是分析在我们组织中发挥主导作用的活跃领域。我们最终可能会有相当大的变化,对当前的工作流程和工作方式产生相当大的影响。蓝色的两个圆圈是我将进一步探索的地方。
这是我们的黄色创新漏斗。我们有一系列的决策门贯穿顶部,从D0到D4。基本上,我们试着从左到右接受想法和概念。
在底部,你可以看到两个重叠的三角形,在这里我们有一个重叠的部分,我们从一个数字化团队,也就是我现在坐的地方,一直到它本身
我们尝试和做的是在范围界定和创新阶段,我们参与其中。我们生产POC概念、最低可行产品,并尝试证明其价值。然后,它逐渐被引入,我们尝试并确定全面部署解决方案和维护策略的范围,以便我们能够为业务提供全面的价值。万博 尤文图斯s manbetx 845
另一件我想提醒大家注意的事情是所有的点。所以,它是——把它看作是组织中想法数量的标准化指示。我想强调的是,我们完全可以在每个决策关口都有大量的搅动,所以这是关于确保你在组织中充分发挥作用。以及n在您完成任务的过程中,我们将您的资源集中在最具价值的解决方案上。万博 尤文图斯
MATLAB在哪里增加价值?这是一个非常快的原型。我们与MathWorks Consulting签订了积极的协议,我们利用该协议提高生产力。
我们希望在MATLAB中维护大量的示例和文档。由于MathWorks在整合一些深度学习技术方面的巨大关注,比如说在去年,我们能够利用该领域的一些最新发展,同时也能够访问这些有利的模块积压。我们非常喜欢web应用程序的交付,所以我们绕过了很多关于安装MATLAB版本的问题,让我们的一些软件运行起来。
这里我们有两个我们制作的网络应用的例子。右上角是一个沥青测试的web应用程序。在左下角,你还可以看到我稍后将讨论的内容的预览,即作为web应用程序的地形分类。
我们还对MDC进行了一些实验,因此使用了MATLAB分布式计算服务器。因此,这使我们能够利用云上相当强大的GPU。我们主要用它来训练我们的一些深度学习模型。
因此,就今年而言,我们在Shell和MATLAB之间取得了不少里程碑式的进展。现在我们终于看到了--因为Shell有时有一些管理功能,所以很难为业务的不同部分获得许可证。现在我们有了一个企业范围的交易。因此,这意味着,无论来自何处,加入组织的任何聪明人,从理论上讲,最终都可以通过MATLAB快速获得生产力。
我们有了第二个MPS许可证。正如我所说的,我认为MDC将成为一个越来越重要的功能。我们正在考虑将其与我们的战略更加一致。
正如我所说的,MathWorks咨询公司一直在高效地利用我们的时间。然后,我们现在也希望利用班加罗尔的一些资源,尝试让我们能够24小时推进项目。
好啊这是第一个例子。这是标签识别。所以你能在背景中看到的是一件工业设备。我想是个水泵。
但在下面,我想提请你们注意的是那个标签,那个标签。标签上有SAP代码。我们有这些图片,它们都是地理标记的,都是在工业环境中。我们要做的是提取标签,对其进行OCR,然后将其链接到我们的SAP系统,因为我们可以从SAP系统中提取大量元数据。
所以我们采取的最初方法是使用R-CNN,一种区域卷积神经网络。因此,我们采取的形象。然后,由于图像非常大,我们需要首先从图像中提取一系列区域建议,然后将其输入CNN。
在我们的例子中,我们使用了-,所以我认为Rick谈到了AlexNet的例子。所以我们使用了一个VGD16网络,然后我们在最后三层上进行了迁移学习。最初,我们只遇到了两个类问题。我们有标记或没有标记。
这是一些图像的样子。想想谷歌街景吧。所以在左边你可以看到它几乎像是用鱼眼镜头拍摄的。所以首先我们需要对图像进行失真校正,这是在MATLAB中完成的。然后想想,它的输出几乎就像你站在一个盒子里,然后你有盒子的六个面向外看。
我们转储顶部和底部的投影,只保留水平的前投影。然后我们将其输入到算法的区域提取部分。在这种情况下,我们稍微修改了它,并使用了一种称为Pdollar EdgeBox的方法。但重要的是,您可以看到,区域很好地提取了就像里面可能有标签一样。
好啊然后通过有线电视新闻网进行报道。所以现在我们只是讨论一下这个的训练。
因此,尽管通过培训,您不需要太多的培训数据,但是,我们在尝试设置足够的培训数据以稳定地执行此操作时仍然存在一些问题。所以我们把标签的定义扩展到了符号。因此,我们还包括了符号,然后进行了数据扩充,以进一步增加数据集,从而提供足够的数据,为您提供稳定的结果。
在右边,你可以看到训练后的激活。因此,这很好地表明了网络在分类之前最初关注的位置。所以这张看起来很奇怪的图片告诉你,它实际上是聚焦在紫色斑块上。这就是算法的输出。
因此,您可以看到内部场景和外部场景,以及不同的照明条件。你得到的是一个包围着它认为是符号的边界框——对不起——什么是符号和标签以及相关的概率。
对于你们当中敏锐的目光,你可能会注意到其中有很多误报。我们要做的是拿出所有可能的选项,然后我们依靠OCR在上面过滤掉很多误报。
好啊所以我刚才向您展示了用于识别工业图像中标签的转移学习,然后在上面运行OCR来提取SAP代码。就运行时间而言,只是给你一个想法,每个图像大约需要3到4分钟。现在在这个特定的用例中,我们可以用它来管理,这很好,但是很明显,如果你想要实时反馈,那是不会发生的。
然而,如果你想走实时路线,有一些技术可以显著提高速度。例如,快速R-CNS,它可以使您的速度提高大约100倍。
我们也在考虑在MDC上增加更多的GPU,大型GPU,以提高图像的分辨率。接下来,我想,很酷的事情是,一旦我们将其连接到SAP系统,我们如何将这些信息带回,比如说,带着增强现实护目镜在网站上走动的人?我们如何将这些信息可视化?这可能是我们的一些客户感兴趣的一个非常令人兴奋的领域。
因此,我们使用的数据来自欧洲的一个工业现场,我们现在从一个亚洲业务部门获得了很多兴趣。因此,我们将继续进行这些活动。
好啊下一个例子是高光谱卫星数据中的地形识别。所以,请快速描述一下为什么这个问题值得解决,为什么我们要麻烦。
因此,在上游,在勘探中,地震数据是我们拥有的最重要的技术之一,以便在地下寻找地下。例如,在底部这个未指明的中东地区,你可以看到它的广阔,对吗?而且获取数据的成本非常高,因此将能量注入地面并接收数据的成本非常高。因此,根据调查,我们每年谈论数千万。这是非常高的成本。
例如,地形类型,平滑与粗糙,可以影响高达50%的成本。因此,在我们的语言中,他们在标记数据方面有一个非常理想的情况,但在他们的语言中,系统效率非常低。因此,他们花钱请一个高度专业化、收入丰厚的个人查看卫星图像并手动绘制pol围着崎岖不平的地形转,他们认为这是崎岖不平的地形。
然后他们必须通过实地考察来证实这一点。所以,必须有人飞到沙漠的这个特定区域,然后开着卡车到处走。他们需要放下旗帜,确认这确实是一个崎岖不平的地形。这是在调查之前。
所以在我们的例子中,因为我们现在有很多训练数据,我们认为,对。也许我们可以用更计算机密集的东西来代替整个工作流程。所以我们决定尝试这种语义分割方法。
这就是我们掌握的数据。我们有三种类型的图像,航空摄影,雷达和深度表面模型,DSM图像。由于2017 B的局限性,我们需要做三个渠道,但在这种情况下没关系。
这在2018年的A和B中得到了改进。但我们决定将其放入三个通道中,对图像进行着色,我们的做法如下。我们对航空摄影进行灰阶处理,将其置于红色通道,雷达置于绿色,等等。然后你会看到这些彩色图像,你可以在右边看到。这是用于算法的。
那么SegNet,它是什么?它通常用于自动驾驶汽车。所以想象一下左上角的一个道路场景,网络所做的就是你把它穿过,然后它将基本上把每个像素映射到一个类。
在上面的例子中,你有,比如,一个路面类,一个道路类,一个树木类,等等。因此,在我们的例子中,我们想重新调整它的用途,并将其用于崎岖或平坦的地形。我们就是这么做的。
目前我们实际上有一个30000个示例数据集,但我们仅在这项工作中使用了1000个示例。因此有很大的改进空间。与上面的图片相比,我们的网络结构稍微简单一些。
因此,我们决定使用三个编码器和解码器部分。就1000个测试示例的培训而言,在4GB的GPU上,这相当小,大约需要8小时的培训时间。
这就是结果。我已经从颜色中移除,并将其分解回原始图像。所以在顶部你可以看到,在左边,航空摄影,然后是雷达和DSM。然后在左边的底部,你可以看到人类,或者我们案例中的基本事实,然后是算法预测的结果。
在这两种情况下,你都可以看到,好的。因为它选择了我选择的数据的快照,所以性能非常好。目前,结果是定性的,而不是定量的,尽管我们将要致力于产生混淆矩阵和所有这些类型的东西。但是性能非常好。事实上,我们向终端客户展示了这一点,他们已经基本上认为性能优于现有的工作流。
我们允许客户通过web应用程序与数据进行交互,因此您可以在此处看到这一点。有了左边的图片,客户可以很容易地进入URL,上传各种图片以及他们想要查看的感兴趣区域。然后在推理步骤的右边,你可以浏览不同的输入和输出图像,覆盖基本事实,这样他们就可以了解结果的含义,以及他们满意和不满意的内容。
好啊因此,就下一步而言,这与最初的工作非常相似。因此,假设我们能从内部获得良好的资金,未来还有很多工作要做。所以我们要做的第一步就是参数调整。
我们将开始考虑从目前的位置增加训练数据量,即1000。我们还将添加更多的类。所以我们有一个设施类,一个城市类,我们想添加到数据中。您可以在右上方看到facilities类的示例。
该应用程序也是如此,我们只是很快——只花了两天时间就制作出了该web应用程序。因此,这就是与MathWorks Consulting进行适当合作的真正力量。我们希望在该web应用程序中添加更多功能,并提供客户所需的内容。
在这个特定的例子中,由于性能已经很好了,而且人们对它非常兴奋,因此有点担心这将如何影响现有的工作流。这包括做这项工作的人。因此,这次我们尝试采用双重集成策略,在提供技术的同时提高员工的技能,使他们能够更好地理解工作流程,更好地理解技术,然后还可能提出新的想法和更好的工作方式,然后我们可以提出来。显然,我们的一些中东单位对这项技术非常感兴趣。但我们现在也收到了一些东南亚业务单位的兴趣。
好的,那么这对未来意味着什么呢?在壳牌内部,这一切都是关于了解总体规划,然后你如何适应总体规划。所以在我们的案例中,我们有这些数字主题。
因此,我们现在要确保我们在内部推广的方式与这些数字主题保持一致,我们已经确定了其中三个主题。利用云的一切,利用MDC的高性能计算,然后是高级分析。例如,利用基于智能应用的技术。
就2018年的当务之急而言,我们希望继续部署MPS和MDC。现在我们已经证明了其中一些解决方案的技术方面,但我们现在需要考虑证明业务价值方面。所以,正如我所说的,我们将研究地形识别和标签识别的进一步进展。万博 尤文图斯
但不幸的是,我今天不能谈论的东西也在地震领域。因此,我们目前正在研究非常陡峭的学习技术,尝试绘制地震数据图,因此只需通过简单的卷积,即可获得地下图像,从而获得油气分布、油气分布和油气属性分布。这是一个非常令人兴奋的领域,我们公司的一些人也在关注这个领域。
好的。我想说的就这些。我希望这是一次有趣的谈话。谢谢。
您还可以从以下列表中选择网站:
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家/地区网站未针对您所在地的访问进行优化。