詹姆斯·马丁,壳牌国际公司
阿姆贾德乔德里,壳牌国际
机器学习和深度学习可用于自动化一系列任务。壳牌和高级分析卓越中心(AACoE)正在使用这些技术来加快流程,同时提高其可靠性。在地理信息学中,可以使用标记卫星图像的丰富训练数据集来改进地形分类。大型(全景)植物图像中的自动标签检测也可以提高维护效率。
James和Amjad将展示MATLAB®让这些技巧的使用变得简单。通过最小的设置,MATLAB并行服务器™允许团队在云中的多个远程gpu上训练网络。MATLAB Production Server™可以让团队创建一个瘦网络客户端,操作人员可以在现场使用,只需要最少的物理硬件,如智能手机。
壳牌利用所有这些技术和工具,使其工程师能够轻松、无痛地使用最新发现。
记录时间:2018年10月3日
在过去四年左右的时间里,高级分析在我们的工作方式中扮演着越来越重要的角色。但今天,我想特别谈谈深度学习,以及如何,特别是在MATLAB中,利用一些深度学习工具来改善我们的创新管道。有趣的是,Rick的主题演讲提到了迁移学习和语义分割。这正是我今天要讲的一些例子。
当然,作为壳牌,我们总是不得不忍受一个谨慎注意。所以我会离开这个了五秒钟左右的时间,谁想要阅读。好的。
所以今天,我将把我的演讲安排如下。我将向您简要介绍壳牌公司以及我们提供的一系列服务和产品。我还将讨论我们的创新和交付渠道,以及我们如何尝试将创新理念,特别是在高级分析方面,通过IT部门正确维护的最终产品引入创新。然后MATLAB就可以融入其中了。s manbetx 845
然后我将讨论两个用例。正如我提到的,第一个是关于工业图像中的标签识别,然后是高光谱卫星图像中的地形识别。听起来很酷,所以我把它放进去了。最后是下一步,我们要如何从我们已经取得的成果中走出来。
好的。所以,这就是我们总结业务的幻灯片的最新的化身。所以,我们是一个非常广泛的公司。我们范围内的所有从我最初加盟该公司,这是在上游勘探的方式,试图找出油气藏。然后通过发展,我们试着钻水井提取的,通过随后的地方,我们尽量和工艺和完善的产品,通过运输和贸易,我们则提供这些产品的各种最终用户更下游的活动,这可能s manbetx 845包括零售前院,航空,以及润滑剂。
如果我们重新调整这些信息的用途,我们就可以突出分析在组织内部带来的价值。而且--哦,就是这样--我真的想让大家注意的是各种颜色的圆圈。因此,这些都是分析在我们组织中发挥主导作用的活跃领域。我们最终可能会有相当大的变化,对当前的工作流程和工作方式产生相当大的影响。蓝色的两个圆圈是我将进一步探索的地方。
这是我们的黄色创新漏斗。我们有一系列的决策门贯穿顶部,从D0到D4。基本上,我们试着从左到右接受想法和概念。
在底部你可以看到两个重叠的三角形,我们有一个重叠的地方——我们从一个数字化团队,也就是我现在坐的地方,到IT部门。所以
我们尝试做的是在确定范围和创新阶段,我们参与其中。我们生产POC概念,最小可行产品,尝试并证明其价值。s manbetx 845然后逐渐引入IT,我们尝试全面部署解决方案和维护策略,这样我们就能完全交付业务价值。万博 尤文图斯
我想使人们关注的另一件事是所有的点。所以it's--认为它是几乎像的想法数量在左侧的组织标准化迹象。而我想强调的是我们每个决策门大客户流失完全确定,所以它是关于做完全组织内务必范围。然后,当你进行到底得到,我们集中你的资源,确实,在大多数高价值的解决方案。万博 尤文图斯
哪里MATLAB增加价值?这是非常快速原型。我们与MathWorks的咨询,这是我们在杠杆作用,以提高我们的生产力的积极协议。
我们希望在MATLAB中维护大量的示例和文档。由于MathWorks在整合一些深度学习技术方面的巨大关注,比如说在去年,我们能够利用该领域的一些最新发展,同时也能够访问这些有利的模块积压。我们非常喜欢web应用程序的交付,所以我们绕过了很多关于安装MATLAB版本的问题,让我们的一些软件运行起来。
所以在这里,我们已经得到了我们生产的Web应用程序的两个例子。就在右上方是沥青测试的Web应用程序。而在左下方你也可以看到什么,我将在以后讨论先睹为快,这是地形分类作为一个Web应用程序。
我们也尝试了一些MDCS,也就是MATLAB分布式计算服务器。这让我们能够在云上利用非常强大的gpu。我们主要用它来训练我们的一些深度学习模型。
因此,就今年而言,我们在Shell和MATLAB之间取得了不少里程碑式的进展。现在我们终于看到了--因为Shell有时有一些管理功能,所以很难为业务的不同部分获得许可证。现在我们有了一个企业范围的交易。因此,这意味着,无论来自何处,加入组织的任何聪明人,从理论上讲,最终都可以通过MATLAB快速获得生产力。
我们已经得到了第二MPS许可证。正如我说的,MDCS,我认为,将是一个日益重要的特征。我们正在寻找使这一更加符合我们的战略。
MathWorks咨询公司,正如我所说,非常有效地利用了我们的时间。然后我们现在也希望利用我们在班加罗尔的一些资源,让我们能够夜以继日地推进项目。
好的。所以这是第一个例子。这是标签识别。所以你可以在后台看到的是一片工业设备。我认为这是一个泵。
但在下面,我想让你们注意的是,那个标签,那个标签。标签上有一个SAP代码。我们有这些图片,它们都有地理标记,都在工业环境中。我们要做的是提取那个标签,对它进行OCR,然后把它连接到我们的SAP系统,因为我们可以从SAP系统中提取大量的元数据。
所以我们采取的最初方法是使用R-CNN,一种区域卷积神经网络。因此,我们采取的形象。然后,由于图像非常大,我们需要首先从图像中提取一系列区域建议,然后将其输入CNN。
在我们的例子中,我们用。我想Rick讲过AlexNet的例子。所以我们改用vgd16网络,然后为了我们的目的,我们在最后三层进行了迁移学习。一开始我们有两个类问题。我们只知道有没有标签。
这是一些图像的样子。想想谷歌街景吧。所以在左边你可以看到它几乎像是用鱼眼镜头拍摄的。所以首先我们需要对图像进行失真校正,这是在MATLAB中完成的。然后想想,它的输出几乎就像你站在一个盒子里,然后你有盒子的六个面向外看。
我们把顶部和底部的凸出部分去掉,只保留前面的水平凸出部分。然后我们将其输入到算法的区域提取部分。在本例中,我们稍微修改了它,并使用了Pdollar EdgeBox方法。但重要的是你可以看到这些区域很好地提取了可能有标签的区域。
好的。然后再传送给CNN。所以现在讨论的只是训练。
所以,尽管在训练中你不需要太多的训练数据,但是,我们仍然有一些问题,试图有足够的训练数据集,让它以稳定的方式运行。所以我们把标签的定义扩展成了符号。所以我们也加入了符号然后做了数据扩充进一步增加数据集以提供足够的数据给你一个稳定的结果。
在右边,你可以看到训练后的激活。因此,这很好地表明了网络在分类之前最初关注的位置。所以这张看起来很奇怪的图片告诉你,它实际上是聚焦在紫色斑块上。这就是算法的输出。
你可以看到室内场景和室外场景,不同的照明条件。你得到的是一个边界框,围绕着它认为的符号,不好意思,符号和标签与相关概率。
如果你有敏锐的眼光,你可能会注意到里面有很多假阳性。我们想要做的是拿出所有可能的选项,然后我们在此之上依靠OCR来过滤掉很多假阳性。
好的。所以我刚刚展示了迁移学习被用来识别标签工业的图像,然后将在上面运行OCR提取SAP代码。在运行时而言,只是给你一个想法,它的周围每个图像三到四分钟。现在,在这个特殊的使用情况下,我们可以与管理,这很好,但很明显,如果你想这是不会发生的实时反馈。
然而,如果您想沿着实时路线走下去,有一些技术可以显著地提高速度。例如,快速的r - cnn,它的速度可以提高大约100倍。
我们也在寻找更多的GPU,更大的GPU在MDCS上,允许我们增加图像的分辨率大小。接下来,我想,很酷的事情是一旦我们将这个连接到SAP系统,我们如何将这些信息带回来,比如说,让那些带着增强现实眼镜在网站上走动的人?我们如何将这些信息共同形象化?这可能是一个非常令人兴奋的领域,我们的一些客户感兴趣。
因此,我们使用的数据来自欧洲的一个工业现场,我们现在从一个亚洲业务部门获得了很多兴趣。因此,我们将继续进行这些活动。
好的。所以接下来的例子是在高光谱卫星数据地形识别。因此,只要迅速的,为什么这个问题的值得解决,为什么我们费心的描述。
所以在上游,在勘探中,地震数据是最重要的技术之一,我们可以通过它来观察地下。例如,在底部这个未指明的中东地区,你可以看到它的扩展,对吧?而获取数据的成本,也就是把能量放入地面并接收,是非常高的。所以我们说的是每年数千万的调查。这是非常高的成本。
地形类型,平滑与粗糙,例如,会影响高达50%的成本。因此,在我们的语言中,他们有一个非常理想的情况来标记数据,但在他们的语言中,这是一个非常低效的系统。所以他们花钱请了一个高度专业,高薪的人来查看卫星图像,然后在崎岖的地形周围手工绘制多边形,他们认为崎岖的地形。
然后他们必须通过实地考察来证实这一点。所以必须有人飞到这片沙漠的特定区域,然后开着卡车到处跑。他们需要放下旗帜来确认这确实是崎岖的地形。这是在调查之前。
在我们的例子中,因为我们现在有很多训练数据,我们认为,对。也许我们可以用一些更计算机密集的东西来代替整个工作流程。所以我们决定尝试这种语义分割方法。
这是我们的数据。我们有三种图像,航空摄影,雷达,和深度表面模型,DSM图像。由于2017年B的限制,我们需要做三个渠道,但在这种情况下是可以的。
这在2018年的A和B中得到了改进。但我们决定将其放入三个通道中,对图像进行着色,我们的做法如下。我们对航空摄影进行灰阶处理,将其置于红色通道,雷达置于绿色,等等。然后你会看到这些彩色图像,你可以在右边看到。这是用于算法的。
SegNet是什么?它通常用于自动驾驶汽车。想象左上角有一个道路场景,网络所做的是你把它传送过去,然后它基本上会把每个像素映射到一个类。
在上面的例子中,你有,人行道类,道路类,树类,等等。所以在我们的例子中,我们想要重新利用它,将它用于粗糙的地形或平滑的地形。这就是我们所做的。
目前我们实际上有3万个样本数据,但是我们,只是为了这个工作,用了1000个样本。所以还有很大的改进空间。与上面的图相比,我们也有一个稍微简单的网络结构。
所以我们决定使用三个编码器和解码器部分。对于1000个测试例子的训练,在4g的GPU上,这是相当小的,大约8个小时的训练时间。
所以这些都是结果。我removed--从颜色消失,分解它放回原来的图像。所以在上面你可以看到,在左边,航拍,然后雷达和DSM。然后在左边的底部,可以看到人,或在我们的情况下,地面实况,算法然后预测什么。
在这两种情况下,你可以看到。对于这个选择一个我选择的数据的快照,性能很好。目前的结果是定性的,而不是定量的,尽管我们将要研究产生混淆矩阵和所有这些东西。但是表现非常好。实际上,我们向终端客户展示了这一点,他们已经认为性能优于现有的工作流程。
我们允许客户通过网络应用程序与数据进行交互,这就是你现在看到的。有了左边的图片,客户可以很容易地进入URL,上传各种图片和他们想看的感兴趣的区域。然后在推断步骤之后的右边,你可以浏览不同的输入和输出图像并覆盖基本事实,这样他们就可以得到结果的意义,以及他们满意和不满意的地方。
好的。所以在接下来的步骤而言,这是非常喜欢的初步工作。因此,有很多未来的工作要做,假设我们能获得良好的资金在内部。所以一些我们要做的第一步是参数调整。
我们将开始寻找从我们的时刻,这是1000我们将添加更多的类以及其中增加训练的数据量。因此,我们有一个工具类,都市类,以及我们要添加到数据。你可以在上面看到那里的设施类的一个实例。
还有,我们刚刚quickly--它的应用程序只用了两天就作出这样的Web应用程序。所以,这与MathWorks的咨询有适当合作的真正力量。我们要进一步增加功能合并到Web应用程序,并提供客户想要的是什么。
对于这个特别的例子,由于它的性能已经很好了,而且人们对它很兴奋,所以有些人担心它会如何影响现有的工作流。这也包括工作人员。所以这次我们试图dual-integration策略,我们都提供这项技术同时也技能提升员工,这样他们就可以了解工作流程,了解这项技术,然后还可能想出新的想法和更好的工作方式,然后我们可以想出。我们的一些中东公司,显然,对这项技术非常感兴趣。但我们现在也收到了一些东南亚业务部门的兴趣。
这对未来意味着什么呢?在壳牌,最重要的是了解总体规划以及如何融入总体规划。所以在我们的案例中,我们有这些数字主题。
所以我们现在要确保我们内部推广的方式与这些数字主题一致,我们已经确定了其中三个。利用云端的一切,使用MDCS进行高性能计算,然后进行高级分析。例如,基于智能应用程序的技术。
就2018年当前的优先事项而言,我们希望继续部署MPS和MDCS。现在我们已经证明了一些解决方案的技术方面,但我们现在需要看看证明业务价值方面。万博 尤文图斯所以,就像我说的,我们要看看地形识别的进一步进展,标签识别。
但不幸的是,有一件事我今天不能讲,也是在地震领域。因此,我们目前正在寻找非常复杂的学习技术,试图绘制地震数据,通过简单的卷积,从地下图像到储层分布,油气分布,油气属性分布。所以这是一个非常令人兴奋的领域,我们公司也有不少人在关注。
好的。这就是我要说的。我希望这是一次有趣的谈话。谢谢你!
您还可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。