如何用MATLAB中的时间序列数据进行预处理的吗
在这段视频中我们演示如何处理和清洁时间序列数据存储在Excel表,在多种格式,并在MATLAB与多个采样率®。我们开始使用导入工具导入Excel的数据表。接下来,我们关注的是如何准备时间表数据类型的数据转换。
然后我们探讨预处理功能可提供时间表包括同步数据集引用一个共同的时间,评估数据质量,并处理重复和缺失的数据。最后,我们展示的堆叠阴谋与行乘以变量。
介绍
数据科学总是说,80%的时间是花在准备数据,20%的时间是花在抱怨需要准备数据。让我们试着解决这个问题,准备和预处理时间序列数据在更少的时间和MATLAB的几行代码。
演示
对于这个示例,我们将使用数据从相量测量单元(pmu)
- 我们有15 pmu测量电压大小、电压角度,GPS时钟系统和频率同步
- 它们在3个时区在澳大利亚东部夏令时区,日光节约时间区,中部和东部标准时间
- pmu是在三种不同的采样率采样:30,120赫兹
- 这发生在不同的时间偏移量的pmu没有在同一时间开始记录
是的,我们有数据需要对齐和清洗进行进一步分析。
我们的数据在三个Excel电子表格,一个为每个三个时区,我们将使用导入工具导入数据。如果我们在MATLAB中打开电子表格,默认情况下,在导入工具打开。点击导入数据。这些数据随后会被存储在工作区中作为一个表。
处理时间序列数据和工作的详细时间函数,MATLAB数据类型时间表
使得处理更加容易。将表格转换成时间应该在时间表datetime
格式。
现在我们将从每个表中提取时间列,将它转换成datetime使用datetime
函数。在同一个行代码,我们正在处理数据集的第一个挑战;数据是在三个不同的时区不同的偏移量。在相同的步骤我们调整时区,时区的选择:澳大利亚东部时间/悉尼,澳大利亚阿德莱德/中部夏令时和澳大利亚东部标准时间/布里斯班。
让我们画频率测量的时间从每个PMU对齐视觉确认时间。当我们看到频率重叠。因此,我们有时间正确对齐。
一旦我们的datetime格式,对齐列,我们我们所有的三个表转换成时间表使用函数table2timetable
。我们现在有三个表的格式时间表。
接下来,我们继续清理数据。我们可以看到在这个与MATLAB的文档,我们可以使用各种工作流处理和清洁时间表如发现和删除丢失的数据,排序和删除重复等。
在这里我们将演示使用重复的时间的一种方式。首先,与独特的功能我们创建一个向量UniqueTime
它返回的独特和排序行时间变量。这个向量不包含重复的行乘以。这里只是为了验证我们检查,我们有7个重复行边缘。我们使用来处理调整时间
函数来计算所有其他变量的意思是重复的行。因此,现在我们有一个新表UniquedataACDT没有重复的行乘以。我们做类似的过程对于其他两个表。现在我们将使用三个新表。
缺失的数据可以以不同的方式处理。我们可以使用一个时间表次rmi
函数与缺失数据和删除所有的行。我们在这里UniquedataACDT表。
另一种方法是使用插值而加入表。
我们加入所有的三个表到一个时间表使用同步
函数。同步收集来自所有输入的变量时间表和输出一个时间表和所有连接水平的变量。
这里我们指定联盟
同步向量,包括次从所有三个时间表。和线性
填写缺失的时间表元素和线性插值。
因此现在我们有一个总表组成的所有三个干净的时间表。
一旦我们有数据清理,我们可以做一些视觉策划的分析数据。
在这里我们展示一个例子使用stackedplot
函数。Stackedplot
情节的变量对行乘以一个时间表。我们把电压大小VM6 VM1, VM11兑行乘以总总表。
请看描述看到更多的资源在数据预处理和下载的代码试试你的数据集。
谢谢你!
你们可以合理选择联合国网站web在liste如下:
优化器les表演du网站发表评论
倒优化器les表演du网站,selectionnez洛杉矶地区中国(en考点或英语)。Les网站de MathWorks倒变量支付不是优化倒Les visites provenant您的地区。