利用机器学习和深度学习对地下公用事业配电电缆系统中的风险进行分类
Steffen Ziegler, IMCORP
利用机器学习算法和深度学习算法预测地下配电电缆系统故障。预测性维护首先要了解电缆系统故障是如何发生的。分析和解释现场局部放电(PD)测量结果对人类来说是一项复杂的任务。机器学习算法和深度学习算法用于自动识别和分类PD测量中包含的缺陷标记。这些算法用于根据即将发生故障的风险对不同的缺陷类型进行分类。区分具有“高、低风险缺陷”和“无缺陷”的电缆可以实现预测性维护。将给出已识别缺陷的例子。
我叫Steffen Ziegler。我是IMCORP的信号分析和人工智能主管。今天我要介绍的是Shishir Shekkar,他是the MathWorks能源公用事业行业的全球经理,他提出了一种机器学习和深度学习的方法,为地下公用事业配电电缆系统提供风险分类。
因此,可以对地下配电电缆系统的故障进行预测。每年都有数百万人和数千家企业受到地下电缆系统故障的影响。此外,重要的是要知道,在过去的40年里,电缆和配件制造商已经使用离线50/60赫兹PD测试特定的pC灵敏度水平。
因此,电缆系统维护可以采用不同的方法——反应性、预防性和预见性。预测性维护首先要了解电缆系统故障是如何发生的。分析和解释现场局部放电测量结果对人类来说是一项非常复杂的任务。
因此,机器学习和深度学习方法被用于解决部分缺陷分类的特定挑战。机器学习算法和深度学习算法用于自动识别和分类部分放电测量中包含的缺陷的特定标记。
这些算法用于根据即将发生故障的风险对不同的缺陷类型进行分类。将具有高、低风险缺陷的电缆与无缺陷的电缆区分开来,可以实现预测性维护。将给出已识别缺陷的例子。本报告的最后将介绍预测性维护工作流程。
那么为什么要进行预测性维护呢?正如我已经说过的,每年都有数百万人和数千家企业因地下电缆系统故障而断电或受到影响。这些失败是可以预测的。因此,在故障发生前识别电缆缺陷首先要了解电缆系统故障是如何发生的。
区分高风险和低风险的电缆以及无缺陷的电缆,顺便说一下,无缺陷的电缆数量很大,可以预测电缆系统的维护情况。所以超过99%的固体介质电缆系统故障都与所谓的局部放电有关。
局部放电是电缆绝缘材料的缓慢退化,最终导致故障。因此,40多年来,电缆和配件制造商一直使用离线50 o或60赫兹PD测试,具有特定的灵敏度水平作为质量控制标准。
因此,制造商正在使用他们的工厂和离线测试。他们用50或60赫兹正弦电压的过电压[刺激]电缆。他们同时进行灵敏度测量和校准测量,以确保测量实际上是有意义的。这是在工厂的屏蔽环境中完成的。在法拉第笼中,环境噪声就是这样被去除的。
但是在野外如何做同样的事情呢?在实战中,情况有点不同。你没有法拉第笼和电磁兼容室。你需要有设备以50/60赫兹的频率刺激电缆,消除噪音,你可以像制造商那样根据特定的标准进行校准并收集数据。
我说这个的原因是,如果你想预测地下电缆系统的未来状况,这是非常重要的,那就是测量要尽可能接近实际的运行状况。
非常常用的是维护电缆系统资产的反应式方法。因此,电缆系统故障会导致不可预测的业务中断。但这还不是唯一的坏处。在经济上,电缆的所有者损失了很多钱。首先,必须派出服务人员,而且是在一个未知和不可预测的时间。
这种反应性的方法花费了相当多的钱。客户对停机不满意。能源供应商形象的损失是需要考虑的非常重要的事情。负债指数受到影响。SAIDI, SAIFI, CADI和MAIFI。这些应该保持在规定的特定水平。
利息可能是潜在的附带损害。想想人孔,在电缆故障时,人孔盖可能会飞到空中。所有这些事情都是高度可见的,不仅会造成附带损害,还会损害能源供应商的声誉。
就像Steffen刚才提到的,为什么反应性方法不是一个好方法,因为更换电缆是非常昂贵的。我们从历史上看到,许多公用事业公司使用反应式方法进行维护。最近,他们已经从反应性的方法转向更预防性的方法,即保持特定的改进。
但这仍然有一个问题。你必须做不必要的维护,这可能会浪费时间和金钱。那么如何既节省时间又省钱呢?其中一种方法就是预测性维护。然而,预测性维护并不容易。预测设备何时会出现问题,是一件非常困难的事情。
所以现在我们有技术可以让你进行预测性维护,有机器学习和深度学习的技术,可以帮助你识别你的设备在现场可能发生故障的时候,甚至可以告诉你如何为不同的地下电缆应用领域开发这些预测测量算法。
因此,当你试图开发一个预测性维护算法时,你可以使用多种方法。我相信可以在白盒方法中采用一种更渐进的方法,这是建模的首要原则,或者你可以采用一种黑盒方法,这是一种数据驱动的方法,是一种应用数据驱动建模的方法,也就是你有一些传感器的数据。
然而,这两种方法都有优点和缺点。模型驱动方法与数据驱动方法相结合可能是一种更好的技术,因为它可以让您做出高度准确的预测模型。
在很多情况下,你可能有数据或者你知道这些数字是什么样的。在许多情况下,您可能不知道图形的样子。所以当你不知道图形的样子时,你实际上可以开发系统模型,运行多个模拟,然后使用这些模拟的数据,将其与传感器数据结合起来,开发预测算法。
正如我提到的,你可以使用人工智能技术来开发预测性维护算法。当我们谈论人工智能时,究竟什么是人工智能?人工智能使用不同的技术,要么是机器学习技术,要么是深度学习技术。你可以使用机器学习或深度学习,这取决于你拥有的数据类型,但也取决于你是否知道那个数字是什么样的。
所以如果你没有标记数据或者你不知道电压会是什么样子,你通常会使用无监督学习,你会尝试使用聚类技术。然后你知道失败是什么样子的或者你有标签数据,然后你通常采用监督学习方法。你使用分类或回归的技术。
另一种方法是使用深度学习技术。所以当你有大量的数据时,特别是当你有时间序列数据或图像数据时,你也可以使用深度学习技术。我们会告诉你什么时候可以使用第二种技术,什么时候使用深度学习更有用,什么时候使用机器学习更有用。
机器学习和深度学习的主要区别在于,机器学习通常涉及某种特征提取。所以当你有信号波形或[数百]个波形时,你想要处理某些特征,那么你通常会使用机器学习技术。这些学习方法通常涉及特征提取。你可以跳过这一步,这是深度学习的另一个优势。
所以我将回到机器学习和深度学习之间的区别。深度学习执行端到端学习。也就是说,我们跳过了[特征]提取过程。基本上,我们是通过学习特征,演示和数据中出现的任务来进行端到端学习,这些数据可能是图像,文本,声音数据或来自传感器的数据。
机器学习和深度学习的主要区别是深度学习算法可以检索数据。特别是,当你有大量的数据时,你想要使用机器学习,而如果你使用机器学习方法来处理大量的数据,你的模型将会饱和。因此,当你处理大量数据时,最好使用深度学习方法。
公用事业行业的很多人都在问,我们应该拥有什么样的数据,以便使用机器学习或深度学习技术?这并不重要。您可以使用不同类型的数据。不过,根据数据类型的不同,您可能会使用不同的方法或技术。
例如,如果您正在处理数值数据,则通常使用机器学习或LSTM。如果你有时间序列数据,来自传感器的数据,或者如果你有固定数据,即由你的线工或船员以不同格式记录的日志,你实际上可以使用CNN,卷积神经网络或LSTM。这就是长短期记忆。如果你在看图像数据,如果你有资产的图像,或者你有[植被]图像,你通常想要使用学习技术。
正如Shishir已经提到的,不同类型的学习方法适用于应用阶段。在我们的例子中,我们选择了两种方法。一种是机器学习方法,另一种是部分放电信号波形的深度学习方法。
这些局部放电信号是时间序列数字化信号,它们非常适合机器学习模型,其中提取的时间序列特征正在被处理,或者用于深度学习方法,长短期记忆方法,其中波形实际上是根据时间序列数据中的特征进行分类的。
开发这样一个系统的原因很简单。人类很难将局部放电信号解释得非常一致。所以可能有人用一种方式解读信号另一些人用另一种方式解读信号。所以我们希望有一个系统能够真正地向人类学习,同时又非常精确和一致。这就是我们选择这两种方式的原因。
在这个例子中,我想向你们展示,基于增强树方法的机器学习方法在353,000个标记波形参数的数据池上非常成功。波形实际上是由人类专家分析标记的,而不是一个一个标记的,你可以想象。他们使用一种非常特殊的工具进行标记,人类可以使用这种工具对局部放电信号进行分类,并根据处理需求对部分放电信号进行分类。
所以我们发现,在43个抽象特征中,只有8个是预测到94%的整体准确性所必需的。94%是成功的。我们想知道我们离100%还有多近,我会在几张幻灯片中给你们一些更新。
我们应用于挑战的下一个方法是部分放电时间序列的深度学习方法。所以我们使用了长短期记忆方法,我们将时间剩余信号作为一个特征,并在上面添加了其他特征。这一次,我们将这个模型应用于大约90万个人类标记的信号波形。然后我们发现总体验证准确率为93%。
正如Shishir之前提到的,对于深度学习来说,拥有更多的数据是更可取的。所以我们处理了更多的数据,在更大的数据池中进行了研究,我想给你们举个例子,大约90万个人类标记的波形。93%也不错。但问题是为什么它不能接近100%呢?
原因如下。当你看这条曲线时,概率是根据部分放电信号绘制的。它们按概率排序从1表示真正的局部放电到0,就像非常清晰的非局部放电信号。
您可以看到,您可以将数据池分为三个主要类别。一种是明显的局部放电。另一种是无局部放电。在中间有一个过渡,你会希望它会更陡峭一些。这些是不明确的波形。
所以当我们回过头去看,特别是看模棱两可的信号池时,我们发现其中一些信号实际上有一些特征,让它们看起来像两个方向。这或多或少取决于信号数据的质量。所以我们知道输入必须有特定的质量如果你想非常精确地分类的话。
所以我们可以在这个区域做更好的训练,或者我们可以从一开始就清理信号。以上就是信号捕获和信号处理的全部内容。或者我们可以对特定区域应用不同的模型,以获得更高的验证精度。
如您所知,与处理信号相比,处理图像要容易得多。当我们尝试在信号应用中使用深度学习方法时,我们使用了相同的想法。正如Steffen所解释的,他们如何在这些信号上使用LSTM,所以从同一个例子向前推进,你实际上可以将这些时间序列数据的信号数据转换成图像或时间频率转换。
这种技术很容易解释或分析那些部分放电信号。你会看到如何将这些时间序列数据转换成时间频域,你可以通过观察不同的图像模式来识别[地下]电缆中的风险。
这张幻灯片展示了LSTM长短期记忆网络是如何在MATLAB中训练的。我之前讲过这个90万人的池子。因此,在实际选择用于训练的数据时,在开始训练模型之前,需要考虑积极特征和消极思想特征之间的比例、想要运行的特定epoch数、迭代次数以及特定的数据调理。
在这种情况下,模型训练需要几个小时,有时甚至几天。我们发现在LSTM网络中找到合适的训练方法是数据的重要条件。正如我之前提到的,93%或94%的准确率已经很好了,但我们想要提高它,使模型与人类相比几乎同样好。
Shishir之前提到的另一种帮助我们学习一些信息的方法是卷积神经网络方法。卷积神经网络在图像识别或图像特征识别方面有很好的应用前景。
因此,局部放电数据也可以转换成图,其中局部放电大小(以[皮科伦]为单位)是根据激励电压的相位绘制的。这就是你们在这个演示的底部看到的两张照片。
这些是有意义的。这些图片可以揭示电缆局部放电缺陷的性质。具体来说,当局部放电缺陷是基于相关联的电气树状结构(即电缆绝缘中的微小缺陷)时,这些缺陷的失效风险要比其他类型的缺陷高得多。
因此,我们和我们的客户都有兴趣找出最终导致电缆故障的高风险缺陷。在这种情况下,我们发现卷积神经网络在识别与电树形相关的部分放电缺陷方面训练得非常成功。这让我们能够设计一个局部放电严重程度的因素,现在实际上是作为一个特定的局部放电缺陷的风险分类。
这是由机器自动完成的,所以人类会被提醒,可能有比其他缺陷更危险的缺陷,这实际上有助于我们通知我们的客户,电缆中有特定的缺陷,需要比其他缺陷更紧急的关注。所以它允许实际操作人员——网络所有者,有线网络所有者——对电缆维修进行分类和优先级划分。
这是机器自动为我们发现的电气树型缺陷的几个例子。果不其然,当我们回顾这些数据时,我们更深入地研究这些数据,我们发现这些是有线电视网络所有者首先应该关注的。
这些都被保留在数据库中自动分类并优先考虑部分放电缺陷导致故障的风险。
所以我们经常从工程师那里得到一个问题他们试图解决预测性维护算法,我们什么时候开始?所以我还问他们一件事,你们有数据吗?因此,如果你有操作数据,你知道故障是怎样的,你已经记录了这些故障,你可以使用这些数据来获得关键的维护算法并获得洞察。
但在很多情况下,你可能还没有弄清楚。您过去可能没有记录过失败。那么如何开发预测性维护算法呢?所以在那个时候,你可以使用另一种叫做“数字孪生”的方法,你可以实际开发各种设备的仿真模型,然后运行多次仿真,定义故障,并[生成]数据。所以你可以使用这些模拟数据来开发预测性维护算法来获得见解。
在其他情况下,如果你已经有了运行数据,你知道这些数据是什么样子的,你也可以使用某些型号的设备。这两种方法都可以用。然后,您可以运行多个模拟,将模拟结果与已知故障数据结合起来,然后开发预测性维护算法。
在这种情况下,你会有一个更好的结果,因为你有更多的数据来训练你的机器学习和深度学习算法。最后,根据应用程序的类型,您可以通过云或硬件边缘设备部署这种预测性维护算法。
那么一旦你建立了这些预测性维护算法,接下来该做什么呢?所以在很多情况下,你也可以超越预测性维护。您还可以确定您的设备的许多使用寿命。同样,你可以提前很好地知道这些设备的剩余使用寿命,这样你就可以提前做好计划,在现场更换这些设备。
现在,要开发剩余有用寿命算法,有多种方法。您可以使用基于相似性的方法。如果您有运行到故障的数据,捕获系统生命周期内的数据,您可以使用降级方法。如果你唯一的信息是阈值,他们的设备过去没有发生过故障,那么你可以使用生存法。那么你就只有与你训练过的机器相对应的可用数据。所以你可以使用不同的方法来开发剩余使用寿命的算法。
正如Shishir刚才提到的,剩余的使用寿命是一个需要回答的非常重要的问题。特别是当你维护和运营地下电缆系统时,当你需要更换电缆系统时,成本是非常高的。每个人都想回答的问题是,我的地下电缆系统还有多少剩余的使用寿命?
剩余的使用寿命不仅是故障时间的问题,也是何时运营地下电缆系统在经济上不再可行的问题。所以典型的,这就是为什么有一条曲线,我们想简单解释一下,电缆故障随着时间的推移而发展。在电缆真正发生故障之前,这个缺陷已经在电缆中活跃了。
这里的x轴是时间y轴是缺陷的部分放电起始电压。电压越高,瞬态事件,瞬态过电压事件的可能性就越小,瞬态过电压事件,这意味着这是一个非常短暂的短事件,它可以点燃并使这个局部放电缺陷在很短的时间内活跃起来。
所以有一些事情你知道,实际上可以使一个缺陷活跃——闪电。如果雷击击中电缆附近或实际上击中连接到电缆的遮阳板,电缆将看到过电压,并且已经存在的局部放电缺陷在短时间内变得活跃,并继续增长和退化绝缘材料或其他东西。
这实际上是一种方法,在地下电缆中注入人工过电压或高压脉冲,以发现故障。有些东西并不能帮助您找到已经存在的失败。随着过电压暂停或开关事件的发生,它还会继续降低电缆中其他地方的现有缺陷。切断电缆显然会在短时间内产生瞬态过电压。
因此,每当电缆中出现局部放电缺陷时,起始电压,局部放电起始电压,就会下降。所以最终,它会下降到工作电压的水平。但是工作电压,总是开着的,这个局部放电会持续活跃,很快就会失效。
所以在这中间的某个地方——在蓝色和黄色阴影区域之间,基于条件的评估,部分放电评估已经完成。所以我们有一个时间点的测量横跨电缆的情况。基于这个时间点,它应该是可能的,而且实际上也有可能预测出电缆在发生故障之前还需要多长时间。我们会讲到你还需要知道些什么才能做出预测。
总之,预测维护算法到底是做什么的?所以实际上有三个步骤来开发你的预测性维护算法。基本上你在使用预测性维护算法,你在对你的重要设备做出决定。
基本上,你有数据,然后根据这些问题,我的系统是否正常运行,你会产生一个异常检测。如果你的系统运行不正常,你就会进行状态监测,如果你想知道你的设备还能运行多久,那么基本上你就要进行剩余使用寿命估计。
通过观察预测性维护的这些不同方面,你可以做出某些决定,要么更换电缆,要么进行维护。
正如Shishir刚才提到的,地下电力电缆系统的剩余使用寿命取决于许多变量。这可能取决于瞬态过电压,就像我刚才解释的,其他过电压中人为产生的东西,资产的运行在低流量,电流,电缆的温度,还有年龄和其他固有资产的数据。例如,电缆有多长时间了?是什么厂家的?电缆有什么样的护套类型或者它甚至是护套?
所以当你看这张幻灯片的最后,你会看到一整层不同的信息实际上是用来预测电缆的剩余使用寿命的。其他数据。你知道,闪电何时发生,在哪里发生。地理信息。电缆被水淹没的可能性有多大?所有这些类型的信息流入模型,帮助你预测电缆在实际失效前能坚持多久?
所以在你也可以将你的算法部署到云端或硬件上之前,我会解释一下。这张幻灯片讲的是关于部署的不同选择。因此,根据不同类型的应用,例如,如果你要对输电塔、输电线路或输电塔上的绝缘体进行[资产健康状况]监测和预测性维护,或者你试图进行植被管理,你通常会使用直升机进行调查。
各公司正试图探索无人机技术。所以基本上,你的无人机飞过输电线路,飞过路权,拍摄植被,拍摄输电塔,输电线路和其他设备的图像。特别是,一旦图像被拍摄下来,图像就会被发送到云端。
当你有这个MATLAB代码[斜杠]算法在云上运行,然后从这些预测算法中给出结果。然后你可以用结果来做出具体的决定。因此,根据应用程序的类型,可以在云中部署,也可以在硬件上部署。
总之,[Steffan]经历了对地下电缆进行预测性维护的非常好的应用。因此,如果你计划为其他设备构建类似的应用程序,你可以采用数字方法或数字孪生方法,或者你可以两者兼用,这取决于你是否有历史数据,如果你有电压数据,可以显示[故障]的样子,你可以将这些数据与模拟数据结合起来,然后使用这些数据来训练你的预测模型。
这里更重要的一点是,很多时间花在预处理上,因为你可能有来自多个来源的数据。一开始,我给你们看了一张幻灯片,讲的是不同形式的数据。如果你要把测试数据、信号数据、数字数据、监控数据、文本数据结合起来,把所有这些不同格式的数据结合起来可能是一项艰巨的任务,所以我们实际上可以通过这些预测模型来运行它们。
所以平均来说,工程师可能只花50%的时间做预处理。这是非常重要的一步。你的数据越好,你的预测模型就越好,结果也就越好。
所以一旦你有了数据,你想要确保你[清理]了数据,数据的格式是正确的,然后才能真正[开始]开发预测模型。一旦你有了这些预测模型,你就可以将它们部署到云端或硬件上,然后你就可以将它们用于不同的应用程序。
非常感谢大家的聆听。Shishir和我很乐意回答你们的任何问题。非常感谢。
相关产品s manbetx 845
特色产品
统计和机器学习工具箱
您也可以从以下列表中选择一个网站:
如何获得最佳的网站性能
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。