如何使用诊断特性为特征提取|预测性维护设计师,第4部分
从系列:预见性维护
Melda Ulusoy, MathWorks
学习如何提取时域和频谱特性使用诊断功能设计开发预测维护算法。
有成百上千的特征可以从您的数据。你怎么知道哪些功能是很有用的机器学习模型培训?虽然这些模型可以使用一组高维的特性,这些特性需要独特的模型可以准确预测和有效分离不同类型的组织。在这个视频中,我们将讨论如何提取有用的特性与诊断功能设计师三缸泵,机器学习和训练模型与分类学习者错误分类。
在这个视频中,我们将设计一个预测三缸泵的维护算法。我们将演示特征提取使用诊断功能设计和训练机器学习模型与分类学习者。
让我们用三缸泵的例子中,我们已经介绍了第2部分视频。我们要确保泵安全运行和正常。但是我们知道它可能开发这些错误操作时,随着时间的推移。所以我们要设计一个预测维护算法及时发现故障并确定故障类型,因为这将帮助我们找出哪些部分需要固定或替换并相应地安排维修。
从哪儿开始?我们首先从水泵和收集数据进行预处理清理噪音。算法的在接下来的步骤中,我们从数据中提取特征,我们训练机器学习模型。这些模型然后帮助我们不同的故障类型进行分类。这正是事情变得具有挑战性。为什么?因为有成百上千的特性我们可以从我们的数据提取。那么我们如何知道该选哪些特性?我们知道的是机器学习模型默认不聪明,他们不会准确预测不同断层类型如果我们未能训练他们有用和特色。那么我们如何确定一个特性是好还是坏? In this video, we’ll try to answer these questions and give you insights into feature extraction.
让我们从第一步开始的工作流。我们收集流量和压力泵不同故障条件下的测量。这些都是存储在一个整体。在每一行,有长1.2秒流量和压力测量和故障代码对应于不同的故障类型。这个数据已经预处理。所以,我们将继续使用诊断功能与特征提取设计师通过以下步骤。我们首先将数据导入到应用程序,一旦进口,我们可以想象的信号。的的所有测量像流信号。在这些情节,不同的颜色对应不同的故障类型。正如你看到的,没有明确区别不同类型的错误。 That’s why we need to extract features which will help us set different fault types apart. This app lets us compute commonly used time- and frequency-domain features. We select the flow data and compute statistical time-domain features. These are features such as the mean, standard deviation, skewness, and kurtosis. Once the app computes the feature values, they are displayed on the feature table. The app also plots histograms for each feature. Before we discuss how we can interpret these histograms, we will extract some additional features by analyzing our data in frequency-domain.
为什么我们需要更多的功能?我们知道机器学习模型可以处理大量的特性,当训练有很多特性,他们可以做得更好的预测。然而,这仅仅是真实的如果我们有有用的和独特的功能,独特的可以设置不同的故障类型。为了更好地理解这一点,让我们看看这个例子我的同事罗兰美国舒尔使用在她的“机器学习是什么?”视频。有卡片标记三类:一只狗,一只猫或一只鸟。您需要确定功能,帮助区分不同的动物。然后使用这些功能来训练模型,确定东西贴上一条狗,一只猫或一只鸟。一个很好的特性将耳朵。为什么?因为它立即把群的狗和猫群鸟类。 However, by itself this feature is not enough, as there may be dogs and cats whose ears may look similar in size and shape. Therefore, we add additional features such as mouth, nose, and whiskers. These are useful and distinctive features that will help us distinguish different animals. But imagine what would happen if we picked eye color as a feature. Dogs, cats, and birds can all share the same eye color and therefore this feature is not distinctive for separating different animals. These kinds of features will act as noise to our machine learning model and can even hurt the model’s performance and lead to inaccurate predictions. Because of what we just discussed, we’ll now extract some additional features and then we’ll rank all the extracted features to determine the most useful ones for training a machine learning model.
到目前为止,我们只计算泵的时域特性数据。但这些特性本身可能不足以区分正常和健康的操作。这是与前面的示例中,耳朵并不足以区分不同的动物。我们知道泵旋转组件和它的数据是周期性的。因此,频域分析可以揭示一些重要的正常和健康的操作之间的差异可以帮助我们更好地独立的故障类型。现在我们将继续提取额外的频域特性。为此,我们首先需要计算流信号的功率谱。有参数和非参数选择计算光谱。你可以试着出去看哪一个最适合你的信号。在这里,我们会与自回归模型,我尝试了这些选项,我知道自回归模型是有效的。 On the spectrum plot, we notice that different types of faults are more separable when compared to time-domain signal. For example, we can easily set apart the red and green curves corresponding to these faults.
现在我们准备计算光谱特性。最常用的功能是列在这里。这些特性,比如光谱峰值,模态系数,和乐队的力量。在这里,我们不会保持整个频带,但我们会选择一个较小的范围,使其包括前五个山峰。为什么?因为数据在更高频率是嘈杂的,很难区分光谱峰值。因此,任何特征提取这部分情节可能不会有助于更好的分类,当我们训练机器学习模型。记住,如果我们不能选择有用的特性,可能会损害我们的机器学习模型的性能做出正确的预测。
到目前为止,我们确定时间和频域特性的流数据。我重复同样的过程与压力数据提取的附加功能。很高兴有许多特性作为机器学习的模型可以工作一组与高维的特征。左边列出的所有计算功能现在在这里,我们也有直方图。在这些情节,不同的故障类型与不同的颜色突出显示。理想情况下,我们希望有一个这样的情节。在这里,除了彼此所有不同颜色的分布。如果我们的直方图情节看起来像这样,我们很容易区分不同类型的错误。但相反,他们类似于这个,有很多不同的故障类型之间的重叠。由于这种重叠和大量的特性,对我们来说真的很难告诉最有用的特性通过看这些情节。 However, this app lets you rank these features to determine the ones that will help us effectively separate different types of faults.
当我们点击“排名功能,”应用程序使用单向方差分析来计算排名分数的所有特性。方差分析测试的结果显示在右边,而酒吧左边显示了不同特性的标准化分数。培训机器学习模型,我们将选择功能,有很高的方差分析分数和遗漏的一个小得多的分数,因为这些不会导致训练模型。提取特征来训练模型时,你会发现自己尝试不同的特性,看哪一组适合分类故障类型。因此,这些步骤可能会迭代当你设计算法。
现在我们准备出口提取的特征分类学习者训练机器学习模型。应用进口的所有特性和故障代码。我们可以想象不同特性彼此,看看他们如何分类错误。不同的故障代码显示不同的颜色。现在,我们将所有可用的训练分类器类型,显示在左侧面板。我们得到了这种分类器的精度最高。评估这个训练模型的性能,我们还可以看看混淆矩阵显示我们准确和不准确的预测。我们看到训练模型估计大部分的故障类型,精度高。但有情况下,估计差。的原因之一可能是正常和故障状态对这些故障的数据类型是非常相似的,因此很难区分彼此。 But it can be also due to the set of features we selected. As we mentioned before, this part of the algorithm is iterative. If we’re not satisfied with the performance of the trained model, we need to go back and select a different set of features and evaluate the performance of this new model.
在这个视频中,我们看到了如何提取特征使用诊断功能设计开发预测维护算法。我们还讨论了如何使用分类学习者训练机器学习模型。不要忘记检查我们之前的视频在本系列中,和产品页面了解更多如何发展你的预见性维护算法和MATLAB仿真软件。万博1manbetx
相关产品s manbetx 845
了解更多
也seleccionar uno de来说《国家/语言:
科莫obtener el药对rendimiento
Seleccione中国(en语言斜纹棉布裤o单身)对位obtener el药对rendimiento。洛杉矶sitios web de还有《没有范围optimizados对位ser accedidos desde苏ubicacion geografica。
欧罗巴