詹姆斯·马丁,壳牌国际公司
Amjad Chaudry,壳牌国际
机器学习和深度学习可用于自动化一系列任务。壳牌和先进的分析卓越中心(Aacoe)正在使用这些技术来加速过程,同时提高其可靠性。在地理学中,可以使用标记卫星图像的丰富训练数据集来改进地形分类。大(全景)植物图像中的自动标签检测也会导致更有效的维护。
James和Amjad将展示MATLAB®使用这些技术轻松。使用最小的设置,Matlab Parallel Server™允许团队在云中的多个远程GPU上培训网络。Matlab Production Server™允许团队创建薄型Web客户端,该网站的运营商可以使用,最小的物理硬件,如智能手机。
Shell利用所有这些技术和工具,以便其工程师可以轻松而无痛地使用最新的调查结果。
记录:2018年10月3日
在最后四年左右的外壳中,高级分析在我们做事的方式上发挥着越来越重要的作用。然而,今天,我想特别谈论深度学习,以及如何在Matlab中,我们如何利用一些深入的学习工具来改善我们的创新管道。有趣的是,瑞克的主题演讲提到提到转移学习和语义细分。这正是我今天我会和你交谈的一些例子。
当然,作为壳牌,我们总是要发出警告。我把这个留给那些想读的人5秒钟左右。好的。
所以今天,我要如下构造我的谈话。我将简要介绍一下我们所包围的外壳和服务和产品的范围。s manbetx 845我还将谈论我们的创新和交付管道,我们如何尝试并带来创新的想法,特别是在先进的分析中,到最终的产品被其妥善维护。s manbetx 845然后在Matlab符合这一点。
然后我将讨论两个用例。正如我提到的,第一个是关于工业图像中的标签识别,然后是高光谱卫星图像中的地形识别。听起来很酷,所以我把它放进去了。最后是下一步,我们要如何从我们已经取得的成果中走出来。
好的。这是我们最新的商业总结幻灯片。我们是一家业务范围很广的公司。我们的工作范围很广,从我刚加入公司时开始,公司是在上游勘探,试图确定碳氢化合物矿床。然后通过发展我们尝试和钻井中提取,然后通过更多的下游活动,我们试着流程和改进产品,通过运输和交易,然后我们提供这些产品的各种终端用户,其中可能包括零售前院,航空、润滑剂。s manbetx 845
如果我们重新批准信息,我们可以突出显示分析在组织内的那一刻的价值。而且 - 哦,这就是我 - 我真的要注意的是各种颜色的圆圈。因此,这些是分析在我们组织中发挥主导作用的活动区域。我们可能最终有很大的变化,对当前的工作流和工作方式产生了相当大的影响。蓝色的两个圈子是我将进一步探索一下。
所以这是我们黄色的创新漏斗。我们有一系列横跨顶部的决策门,D0到D4。基本上,我们试图从左边的左右取决于想法和概念。
在底部,您可以看到我们有一个重叠的两个重叠三角形 - 我们从一个数字化团队移动,这是我目前坐在哪里的。所以
我们尝试和所做的是在范围和创新阶段,我们参与其中。我们生产PoC概念,最低可行的产品,尝试证明价值。s manbetx 845然后逐渐被带入,我们尝试和扫描完全部署解决方案以及维护策略,因此我们可以充分为业务提供价值。万博 尤文图斯
我想让大家注意的另一件事是所有的点。可以把它想象成左边组织中想法数量的标准化表示。我想强调的是,我们完全可以接受每个决策门的大量变动,所以这是关于确保你在组织内充分考虑。当你完成最后阶段时,我们将你的资源集中在最有价值的解决方案上。万博 尤文图斯
MATLAB在哪里增加价值?这是非常快的原型。我们与MathWorks Consulting达成了积极的协议,我们利用该协议来提高我们的生产力。
我们希望在Matlab中维护有一系列大量的示例。由于MathWorks融入了一些深入学习技术的巨大焦点,例如,在去年,我们能够利用这些空间的一些最新发展,同时也能够访问这个有利的积压模块。我们真的喜欢Web应用程序交付,所以我们绕过了很多关于安装Matlab版本的问题,以获得我们的一些软件运行。
这里有两个我们制作的网络应用的例子。右上角是一个关于沥青测试的网络应用程序。在左下角,你还可以看到一个预览我稍后会讲到的内容,那就是作为网页应用的地形分类。
我们也尝试了一些MDCS,也就是MATLAB分布式计算服务器。这让我们能够在云上利用非常强大的gpu。我们主要用它来训练我们的一些深度学习模型。
因此,根据今年,我们在壳牌和Matlab之间有很多里程碑。我们现在终于 - 因为Shell有时有一些管理员,那么获得业务的不同部分的许可证非常困难。所以现在我们有企业范围的交易。所以这意味着任何聪明的人,无论他们从那里加入组织,都可以在理论上迅速获得Matlab的效率。
我们有第二张警司执照。正如我所说,MDCS,我认为,将会成为一个越来越重要的特征。我们正在考虑将其与我们的战略更加一致。
正如我所说,Mathworks Consulting一直非常富有成效的时间。然后我们现在也希望利用我们在班加罗尔的一些资源来尝试,并允许我们进入时钟周围的项目。
好的。这是第一个例子。这就是标签识别。你在背景中看到的是一件工业设备。我想这是一个泵。
但在下面,我想让你们注意的是,那个标签,那个标签。标签上有一个SAP代码。我们有这些图片,它们都有地理标记,都在工业环境中。我们要做的是提取那个标签,对它进行OCR,然后把它连接到我们的SAP系统,因为我们可以从SAP系统中提取大量的元数据。
因此,我们采取的初始方法是使用区域卷积神经网络的R-CNN。所以我们拍摄图像。然后,由于图像非常大,我们需要从图像中提取第一系列建议,然后将其馈入CNN适当。
在我们的情况下,我们使用的是 - 所以我认为瑞克谈到了AlexNet的榜样。因此,我们使用了一个VGD 16网络,然后我们确实为我们的目的转移了最后三层的学习。最初在这里,我们刚刚获得了两类问题。我们刚刚得到了标签或没有标签。
这是一些图像的样子。想想几乎谷歌街景。所以在那里,你可以看到它几乎就像它被用鱼眼镜镜头拍摄了。因此,首先我们需要对图像的图像应用失真校正,该图像是在Matlab内完成的。然后想到 - 这几乎就像你站在一个盒子里面,然后你有六个面的盒子看。
我们倾倒顶部和底部预测,我们只是保持水平预测。然后我们喂给算法的区域提取部分。在这种情况下,我们略微修改它并使用称为Pdollar边缘框方法的东西。但重要的是,你可以看到这些区域很好地提取了可能在那里的标签的区域。
好的。然后再传送给CNN。所以现在讨论的只是训练。
所以,尽管在训练中你不需要太多的训练数据,但是,我们仍然有一些问题,试图有足够的训练数据集,让它以稳定的方式运行。所以我们把标签的定义扩展成了符号。所以我们也加入了符号然后做了数据扩充进一步增加数据集以提供足够的数据给你一个稳定的结果。
在右侧,您可以在培训激活后查看。因此,这是在分类之前网络最初关注的地方的良好指示。所以非常奇怪的图像正在告诉你它基本上关注紫色修补程序。然后这是算法的输出。
你可以看到室内场景和室外场景,不同的照明条件。你得到的是一个边界框,围绕着它认为的符号,不好意思,符号和标签与相关概率。
如果你有敏锐的眼光,你可能会注意到里面有很多假阳性。我们想要做的是拿出所有可能的选项,然后我们在此之上依靠OCR来过滤掉很多假阳性。
好的。我刚刚向你们展示了转移学习被用来识别工业图像中的标签,然后在上面运行OCR来提取SAP代码。在运行时间方面,我给你们一个概念,每张图片大约需要三到四分钟。在这个特殊的用例中,我们可以用它来管理,这很好,但显然,如果你想要实时反馈,这是不可能发生的。
但是,如果您想下降实时路线,有技术可以显着提高此功能。因此,例如,快速的R-CNN,这应该给您提高速度大约100倍。
我们也在寻找更多的GPU,更大的GPU在MDCS上,允许我们增加图像的分辨率大小。接下来,我想,很酷的事情是一旦我们将这个连接到SAP系统,我们如何将这些信息带回来,比如说,让那些带着增强现实眼镜在网站上走动的人?我们如何将这些信息共同形象化?这可能是一个非常令人兴奋的领域,我们的一些客户感兴趣。
因此,我们使用的数据来自欧洲工业网站,现在我们从特别是亚洲业务部门获得了很多兴趣。所以我们将继续使用这些活动。
好的。下一个例子是高光谱卫星数据中的地形识别。快速描述一下为什么这个问题值得解决以及为什么我们这么麻烦。
所以在上游,在勘探中,地震数据是最重要的技术之一,我们可以通过它来观察地下。例如,在底部这个未指明的中东地区,你可以看到它的扩展,对吧?而获取数据的成本,也就是把能量放入地面并接收,是非常高的。所以我们说的是每年数千万的调查。这是非常高的成本。
例如,平滑的与粗略的与粗糙度相比,可以影响高达50%的成本。因此,由于其中,在我们的语言中,他们具有标记数据的非常理想的情况,但在他们的语言中是一个真正效率的系统。因此,他们支付一个高度专业化的,付费的个人,以查看卫星图像并手动绘制粗糙地形周围的多边形,他们认为是崎岖的地形。
然后他们必须用现场访问来证实。所以有人必须飞到这块特定地区的沙漠,然后在卡车上开车。他们需要将旗帜放下以确认这是,确实如此崎岖的地形。这是在调查之前。
所以在我们的情况下,我们现在有很多培训数据,我们认为,对。也许我们可以用更多的计算机密集型更换整个工作流程。所以我们决定尝试这种语义分割方法。
所以这是我们拥有的数据。我们有三种类型的图像,航拍,雷达和深度表面模型,DSM图像。由于2017年的局限性,我们需要做三个渠道,但在这种情况下就可以了。
现在已经改进了2018年A和B.但我们在此决定将其分为三个渠道以使图像着色,我们如下所示。我们缩小了航空摄影,把它放在红色的频道,在绿色,等等的雷达。然后您最终可以使用右侧看到的这些彩色图像。用于算法。
所以segnet,它是什么?它通常用于自动驾驶汽车。所以想象一下左上角的道路场景,网络所做的是你通过它的喂养,然后它将基本上将每个像素映射到类。
所以在顶部的例子中,你有,说,路面类,道路类,树木类等等。所以在我们的情况下,我们想把它重新批准并用它用于崎岖的地形或平滑的地形。这就是我们所做的。
目前我们实际上有3万个样本数据,但是我们,只是为了这个工作,用了1000个样本。所以还有很大的改进空间。与上面的图相比,我们也有一个稍微简单的网络结构。
所以我们决定使用三个编码器和解码器部分。在1,000个测试例子上培训方面,在4千兆字节的GPU上,这很小,它训练时间为8小时。
这就是结果。我去掉了颜色,把它分解成原始图像。所以在上面你可以看到,在左边,航拍照片,然后是雷达和DSM。然后在左下方,你可以看到人类,或者我们的基本事实,然后是算法预测的。
在这两种情况下,你可以看到。对于这个选择一个我选择的数据的快照,性能很好。目前的结果是定性的,而不是定量的,尽管我们将要研究产生混淆矩阵和所有这些东西。但是表现非常好。实际上,我们向终端客户展示了这一点,他们已经认为性能优于现有的工作流程。
我们允许客户通过网络应用程序与数据进行交互,这就是你现在看到的。有了左边的图片,客户可以很容易地进入URL,上传各种图片和他们想看的感兴趣的区域。然后在推断步骤之后的右边,你可以浏览不同的输入和输出图像并覆盖基本事实,这样他们就可以得到结果的意义,以及他们满意和不满意的地方。
好的。接下来的步骤和最初的工作很相似。因此,如果我们能从内部获得良好的资金支持,未来还有很多工作要做。我们要做的第一步是参数调整。
我们要开始增加训练数据的数量从我们现在的位置开始,也就是1000。我们还会添加更多的类。所以我们有一个设施等级,一个城市等级我们想要添加到数据中。你可以在右上角看到一个设施类的例子。
这个应用程序,我们只花了两天就制作了这个web应用程序,这就是与MathWorks咨询公司合作的真正力量。我们希望在web应用程序中添加更多的功能,并准确地提供客户想要的东西。
对于这个特殊的例子,由于表现已经和人们非常兴奋,有一点担心如何影响现有的工作流程。这包括人们在做这项工作。所以这段时间我们正在努力拥有双重集成策略,在那里我们都提供了技术,同时也可以提高工作人员,所以他们可以了解工作流程更多,了解技术更多,然后也许也许可能出现新的想法和更好的工作方式,我们可以想出。我们的一些中东单位显然对这项技术非常感兴趣。但我们现在还获得了一些东南亚企业单位的兴趣。
好的,所以这对未来的意思是什么意思?在shell中,这一切都是关于了解大师计划,然后如何适应大师计划。所以在我们的情况下我们有这些数字主题。
因此,我们现在将确保我们推广这一点的方式与这些数字主题对齐,我们已经确定了其中的三个。利用云端的一切,高性能计算MDC,然后是高级分析。因此,例如,具有基于智能应用的技术。
在2018年的即时优先事项方面,我们希望继续部署MPS和MDC。而且现在我们已经证明了一些解决方案的技术方面,但我们现在需要查看证明业务价值方面。万博 尤文图斯所以,正如我所说,我们将介绍地形识别的进一步进展,标签识别。
但是,不幸的是,我今天无法谈论的东西也在地震领域。所以我们目前正在观察非常陡峭的学习技巧,以试图映射地震数据,所以只是通过简单的卷积来支付碳氢化合物分布,碳氢化合物属性分布的地下的图像。所以这是我们公司中少数人的令人兴奋的区域,也在看。
好的。所以这就是我要说的一切。我希望这是一个有趣的谈话。谢谢你。
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。