电网故障定位检测使用系统仿真和机器学习

帕特里斯·布鲁魁北克电力局

MathWorks和魁北克电力局探索如何使用机器学习系统仿真和开发的算法可以检测故障在电网使用电压凹陷的位置测量。系统仿真是用于生成合成错误数据覆盖更广泛的操作信封比单独测量数据。合成数据用于训练机器学习分类算法。您将了解如何分类算法的性能可用于进一步洞察物理系统的行为和任何限制与训练数据有关。您还将看到如何建议可以由这种洞察力提高系统测量和训练数据集的总体分类精度提高。

你好,每个人。我的名字是格雷厄姆愤怒,我主要在MathWorks电子技术产品经理。我今天加入的帕特里斯·布鲁hydro - quebec研究所的首席科学家,IREQ。嗨,帕特里斯。你好,我的朋友?

我过得很好。谢谢,格雷厄姆。今天我很高兴与你。

在这个演讲,帕特里斯和我将讨论如何使用机器学习系统仿真和开发的算法可以检测故障在电网使用电压凹陷的位置测量。帕特里斯将我们通过提供一些背景知识,故障定位检测,我们将讨论一些魁北克电力局的倡议在这个领域。帕特里斯将描述这个系统在研究和讨论配置仿真模型生成故障数据在多个位置。

帕特里斯树木将会通过回我,我将讨论分类学习者的使用,这是统计和机器学习的一部分工具箱训练和评估机器学习算法。接下来,我将看看分类算法的结果可以帮助指导我们做出建议可能需要额外的测量来提高整体的结果。我将探索减少数据集如何影响分类算法的准确性。这有助于提供指导多少数据需要提供准确分类和限制可能存在什么如果我们训练和减少数据集。然后我们将结束总结。

我想开始通过设置一些上下文在故障定位检测。显然,能够准确地确定断层的位置是高业务价值。精确位置,系统操作员可以采取决定性的行动和维护人员可以更有效地分派。魁北克电力局历史悠久发展先进的故障位置和状态维修的能力。

这方面的一个例子是英里的项目。英里,站在维护和调查。英里,电压测量是在关键位置,他开发了一个对数,将满足故障定位只有基于这些测量。右边的图片我们看到英里故障定位器的显示了一个示例,估计实际的故障。

英里的算法是基于电力系统工程理论。魁北克电力局,像世界各地的许多公用事业,正在探索机器学习可以提供互补运行监测能力和增强。这就是为什么我们很兴奋去探索这个功能与MathWorks代表问题。

系统进行调查是一个径向分布网络,这是系统用于英里的代表项目。验证模拟一个真正的系统。所以我们有一个高水平的信心,模拟故障响应将实际响应的代表。

在这项研究中,有五个电压测量位置显示绿色。我们选择了38个不同位置的应用的缺点。对于每个volt的位置,我们使用288阶段和中立的阻力。这样做是为了产生超过10000故障场景,特别是38断层位置有288场景位置——出现在10000多个场景。

为什么我们的目标是对于这样一个大量的场景吗?对于机器学习,通常数据越多越好。10000年似乎是一个合理的目标。当然,虽然我们可以产生更多的如果需要的话。

我也应该注意,我们正常数据,生成意义的数据模拟,没有错。我们只改变了负载值,使用正态分布配置文件在每个负载。我现在将切换到MATLAB向你们展示我们正在使用的模型和脚本生成仿真数据。

让我们首先看一看Simscape中所开发的仿真模型,我们电气专业的电力系统。分销网络连接通过电网配电变压器。有一个三相线15公里,我分成了三份五公里,也有一个两阶段的分支。

所以我标签的所有块,L1, L2, L3、L4。也有一些单相配电馈线连接到网络。我有一个六人。我贴上L1阶段1。我们也有一个母线测量电压和电流模型中的五个位置。他们标记B1、B2、B3和B4。在这里我们收集所有的信号。对于每一个褶皱,我们测量的积极、消极,零序。我们收集所有的在一个输出信号。

让我们来快速浏览下的三相系统。你看,我把它在1公里部分,使用这个块。这就是我们指定线参数。这让我获得五六分线。所以我可以把一个断层。

目的是断块我可以计划的各种故障类型和故障阻抗。所以我可以设置这个块,然后脚本将沿着线在我们之前看到的所有位置。所以它将允许我应用我之前提到的38的故障位置。m课程,同样也为单相线。

现在,让我们看一看我们使用的脚本生成仿真数据。我去全屏。我们开始吧。

这就是我指定通用的通用参数,定义故障的类型。现在,我将计划只有一个AB与专用接地故障参数。这里,我列出所有10行我有在我的模型中,在那里我将错误使用特殊的标签,我们可以使用。

在这里,我们可以指定行。现在对于这个仿真,假设我们只会1和5。单相和两相线,只是向你展示的原则。之后,这是每一行的列表,我们将添加完整的块。我将做一些会议通过,如果我们做一个三相或单相故障我已经转发给相应设置块如果我们沿着每个部分每一个插入点我会强硬路线所以我连接的完整块的位置我想违约,每张照片的位置我错误阶段和r中性值。

这将给我很大的错——典型的断层位错。下一步,让我们看看。这里,我们来模拟一个,只是向你展示原则。我们会更快的模拟。然后下一步就是启动仿真。模拟和仿真后,保存,一个表中的数据,所以它可以模拟。

现在,让我们开始。糟糕,停止。让我们继续。您应该看到完整的块出现在这个子系统。这是L1。我们开始吧。它连接到第一点,我想对褶皱。模型编译、模拟,然后我将在下一节中,做相同的设置,应用褶皱,收集提交数据,等等等等。我会让它运行的路线。

我们现在开始提交数量4。一旦我们完成这L1线,自动关闭它然后打开单相线路。同样的事情在这里。我在做添加块,我在第一个位置,应用故障模拟,得到的结果,进入下一个。

将会有两个模拟,这个最后一个。好的。现在让我们去MATLAB命令。你可以看到,故障定位和数据表的生成。

让我们快速地忽略的模拟结果。例如,第一个,第一个错误在公共汽车上B1,年ID ABC级阶段,只是向你展示序列参数我计算和获得。看到我最后一模拟在同一总线。

我现在通过回到格雷厄姆,他将讨论使用机器学习工具。

谢谢你,帕特里斯。所以一旦产生的故障数据,然后我们组织在MATLAB表。每个总线电压测量的表包括序列数据和故障分类。我们在这里看到的例子展示了只有几个数据点进行说明。我们有+ 1的序列数据大小和角度以及故障分类。

对于本例,我们为超过10000个场景生成的数据。分类学习者是一个带有用户界面的统计机器学习工具。所以我要开放分类学习者,我可以告诉你它的一些功能。我会注意,我不打算给一个全面的概述,那么下面我给,如果你想要更多的信息,我将鼓励你参考文档。

我要做的第一件事是加载和调用的数据集分类学习者。我使用的项目,所以我可以组织文件和创建快捷方式来帮助我更好地管理我的工作流。我要点击获得源自训练数据。能做的是加载数据,然后调用分类学习者。

如果你喜欢项目的更多信息,请参阅文档。我只会扩大分类学习者全屏。

在分类学习者,我第一次开始一个新的会话从工作区和加载数据。在这种情况下,我的表在MATLAB数据表。现在,它是唯一的变量在工作区中,所以它自动把这个捡起来。如果你有多个数据集变量在工作区中,你会选择。在这种情况下,我不需要这样做。你会发现数据已通过自动默认列本质上是分类,以39独特的分类。我也会提醒我们38断层位置和一个正常的分类。

因为它本质上是分类,分类学习者已经自动捡起故障的响应数据。和数据表中的其他变量T选为预测因子。当然,你有控制。如果没有分类不正确的信息,您可以选择适当的,但在这种情况下,他完全知道我想做什么。

我们现在做的是选择我们想做验证。有两种选择,交叉验证数据分为训练和测试组使用统计方法或抵抗验证,将搁置一定百分比的数据进行测试,然后用剩下的数据削减。

我们将坚持使用默认设置,使用交叉验证五个错误。我们然后单击开始会话。你可以看到我们有违约散点图,在这种情况下显示总线1为正序电压大小。实际上是公共汽车1负序电压大小。

有一些我想观察。首先,正常运行,应用无过错但我们不同的负载值,它似乎非常干净。其实这个小区域的右下角。如果我只是对我们的课程正常向下滚动。它是红色的。如果我上空盘旋。然后我们会得到一些信息选择的数据点。所以你可以看到,正常班。

所以我们可以看到,正常行为很干净,在我们紧张的分布,我们看不到任何重叠的任何过错,条件。我们所期望的正常操作容易分类。第二步是,虽然我们可以看到一个模式的故障数据,我们也看到重叠的数据点,这意味着分类通过传统工程分析将是一个挑战。

让我们现在这个数据的机器学习算法,看看我们可以实现什么。这个地方我总是开始是选择所有快速火车。这将做的是选择一个数量的机器学习算法,,说我提供的数据,将火车在一个相对快速的时间。如果我选择火车,这将自动调用并行池如果你安装了并行计算工具箱,这将允许训练算法从多个核心中获益。

我们可以看到现在我们有很多不同的算法通过训练过程。所以我们只是让少数的经历。正如你所看到的,当他们完成,则出现的准确性。最好的模型所反映出的是白色盒子。现在我们有一个67.9%的准确性。我们只会让这一点,本身我们可以做的更好。优良的资讯是75.9%,80.6中资讯。这是很好。所以我们能做的,而其他的只是想完成培训这是迄今为止最好的一个。

80.6%是什么意思?获得更多有关这个数量,我们可以查看混淆矩阵。所以我们去这里并选择混淆矩阵。混淆矩阵显示我们如何表演的训练数据训练分类器。我们看到,真正的类和预测类。如果我们有一个完美的分类器,我们会看到只在这个矩阵对角条目,而且我们也会有点怀疑的结果。

完美的训练数据分类,命名你的开销的分类算法,或者你有一些数据质量问题。在这种情况下,我们可以看到,我们有一些地方我们有一个独特的非对角的模式,分类,观察与培训相关的数据集,我们可以看到,这里有大量相关的L1 PH3和L1 PH2,这里也和L1 PH5 L1 PH5。分类器是在区分故障行L1 PH2和L1 PH3,也是在分类违约L1 PH4和L1 PH5。

这个问题迫使我们回到物理系统,并确定是否有导致这个结果的物理特性。因此,让我们考虑与我们的系统发生了什么。我们把所有的电压测量上游的叉形线。叉线包含等效电特性。

这意味着,如果一个错误发生在一个叉,说,在F1,在此说明的位置的例子。然后恶魔的电压测量显示,虽然可以检测故障,它不能区分是否故障位置。F1和F2。

再让我们看一下系统模型所以我可以带你叉形线。好的。我们正在与L1 PH2 L1 PH3问题。如果我破产L1 PH2,看看我们这里有四个部分。如果我们去L1 PH3,我们有两个片段。但是11,神经网络,在这里。我们确实有一个叉,相同的电特性。因此,这就是为什么我们有困难在L1 PH2和L1 PH3分类。

这同样适用于L1 PH4和L1 PH5。在这种情况下我们有相同的设置。我们放大一点在这些领域的混淆矩阵,我们有困难。所以我们看到我们有显著的非对角的分类,这是错误的,因为叉形线。那么我们能做些什么来改善这种情况呢?

一个解决方案是使额外的电压测量的叉子。注意,一般来说,我们需要y - 1额外的测量,y分支的数量。所以用两个叉子,这种情况我们已经在我们的系统中,我们只需要一个额外的测量。所以我们更新仿真模型包括额外的测量,在这种情况下,测量在L1 PH2帮助区分L1 PH2和L1 PH3缺点,和测量L1 PH4帮助区分L1 PH4和L1 PH5折叠。

所以我们现在要加载新数据集用额外的测量和再培训的分类算法。我们没有培训新的数据集。现在,记住,最后一次,当我们没有这些额外的测量,在分叉的线是一个问题,我们对所有的最好的结果快速训练是80.6%。让我们让这个经历,我们会看看我们能实现。

75%的树。我们只要给它一个几秒,让一个或两个训练。91.9%。所以我们已经好转反应,但证据在布丁。我们必须看看混淆矩阵,看看我们正在帮助解决特定的问题。

所以我选择好资讯或余弦资讯。他们有平等的准确性。他们可能有不同的结果,但我只选一个看看。我们将看看混淆矩阵。

实际上,我试一试。我们实际上有三个相同的结果。所以现在选择了加权资讯。所以我就选择,我们将看看混淆矩阵。

所以我们不能看到,你可能还记得,我们有一个大大大非对角的分量当我们看着L1 PH2和L1 PH3。所以我们有明显比之前更好的分类。所以那些额外的介绍测量L1 PH2和L1 PH4帮助我们实现更大程度的准确性。这也帮助建立我们的信心,造成的影响我们看到的确是分叉的。

所以我只是让几个点。我只使用所有快速火车。但随着分类学习者,你可以访问一个广泛的模型。这很可能是你想看看支持向量机。万博1manbetx我通常使用二次支持向量机,因为我发现他们更精确。万博1manbetx但他们将需要更长的时间来训练。所以我不训练一个在这个演讲中,因为需要花费更长的时间。但通常你会看到更多的准确性。

另一点是,当你有一个训练有素的模型,您可以按出口模型,然后为您的模型中,您可以选择一个名称并点击OK。然后去MATLAB工作区。所以你可以看到,我们已经训练模型在工作区中,也显示了你要叫它在MATLAB工作区。

所以我将在随后的结果显示在这演讲我使用MATLAB脚本能够这样做。我不会向你展示MATLAB脚本,因为他们只是行代码。我宁愿专注于本课程中的结果。但是我们可以提供脚本,那些想要仔细看看这些工作流。

我们只知道考虑培训使用边界情况。我们这样做的原因是给我们一些有关的数据类型,我们需要成功地训练一个分类算法。特别是,我们可以减少数据集上实现准确的结果吗?

有三个情况下,我们会考虑的。首先,收集培训断层数据只能从第一行部分。第二,培训的错只在最后部分收集的数据。第三,培训断层数据聚集在第一个和最后一个部分。我们可以看到从这里显示的混淆矩阵,我们得到非常精确的结果分类提供数据。这是可以预料到的。

问题是,分类器将如何应对当故障数据从其他部分通过这些模型吗?我们将看一看几行探索与这个系统会发生什么。你让我先东方混淆矩阵你看到。我们专注于右边的结果,在第一部分训练。这意味着我们没有预测类第一节。这就是为什么,如果你看看列在这里,您将看到第二节,第三节和第四节——这些都是空的。这是可以预料到的,因为我们没有在这些训练。

所以考虑到这一点,因此对角线上是最好的,因为我们有数据的场景。如果我们把绿色的盒子,这意味着我们已经确定了正确的长度。例如,我们来看看L1 PH4第二节。这是真正的类不是训练有素的第一部分数据。它被确认为L1 PH4第一节。所以线是一样的,因此绿色盒子。这是最好的部分我们可以做我们没有训练,至少是在正确的行分类。

以外的绿色框意味着我们还没有确定正确的线。所以我们可以看到,通过观察这三个不同的边界情况,我们没有得到令人满意的结果。例如,错误的行为在第一节L1 PH4不包含足够的信息来推断错误在一段L1 PH4可以被认定为属于这条线。

这是另一个例子,L1 PH6。这条线只有两个部分,在最后一节中,我们看到,虽然培训中间反应产生精确的结果对于识别正确的线。培训第一部分是不准确的。当我们看这些结果以及其他结果我这里没有显示,我们得出结论,我们需要广泛的虚假场景在每一个线段为了准确分类故障位置。这也许并不令人惊奇,但剩下的问题是,我们需要什么级别的粒度的部分达到可接受的水平的准确性。

这个问题是本课程的范围之外,但可以通过代探索从仿真模型合成数据。总之,这项研究的结果是令人鼓舞的。我们发现机器学习分类算法可以用来分类故障位置相对较高的精确度。我们看到叉状的线是上游测量问题。所以,在这种情况下,我们建议额外的测量的叉子。

通过这些额外的测量,我们能够实现更好的故障定位分类精度。我们还看了看治疗在降低数据集。我们发现,在这个例子中,培训只在第一个和最后一个部分是不足以找到正确的与一个可接受的精确度。这意味着什么是一个广泛的合成数据有效的机器学习算法训练是必要的。