你有一个不规则的盘中表(情绪)和每日时间表(返回)。这听起来像你想打开情感数据变成了一种日常系列?我认为也许你想会猜测,在每个交易日,消极,中立和积极的帖子的计数。在周末的帖子我想你想忽略。
比方说,你有这样的:
帖子=
10×1个时间表
时间情绪
_____________________________
27-APR-2020二点28分13秒的负
27-APR-2020 6时01分41秒中性
27-APR-2020 9点56分51秒中性
27-APR-2020 13时57分48秒的负
27-APR-2020 21时09分31秒正
28-APR-2020○点31分11秒中性
28-APR-2020二时26分17秒的负
28-APR-2020九点59分27秒中性
28-APR-2020 18时51分41秒的负
28-APR-2020 19时01分19秒中性
有一堆的方法来获得情绪算作独立的日常计数变量;在这里,我会告诉groupcountsto第一个GET计数。在最近少MATLAB的版本中,你可以使用groupsummary,或varfun。groupcounts有一个很好的方式来计算,每天计数,但在这里,你要每天按人气数,称groupcounts之前使离散的次日期。
>> posts.time = dateshift(posts.time,'开始','天');
>> posts2 = groupcounts(文章,[“时间”,“情”])
posts2 =
五×3表
时间情绪GroupCount
______________________________
27-APR-2020的负2
27-APR-2020中性2
27-APR-2020正面1
28-APR-2020的负2
28-APR-2020中性3
现在,你需要为每个单独的情绪的变量;这是拆散。
>> posts3 =拆散(posts2,'GroupCount','情绪')
posts3 =
2×4表
时间负中性正
__________________________________
27-APR-2020 2 2 1
28-APR-2020 2 3的NaN
楠是一个有点讨厌;这是因为拆散默认情况下使用的聚集总结。在R2020a版MATLAB的,这只是出来,你可以解决通过指定@numel,但它也很容易使用replacemissing。
>> posts4 = fillmissing(posts3,'不变',0,'DataVariables'[“负”,“中性”,“正”])
posts4 =
2×4表
时间负中性正
__________________________________
27-APR-2020 2 2 1
28-APR-2020 2 3 0
现在,你是在经营。图出在你关心的期间平日,每天创建日期时间向量,您的文章和你的回报时间表同步到时间向量。
2条评论
直接链接到本评论
//www.tianjin-qmedu.com/matlabcentral/answers/518620-merge-or-join-two-data-sets#comment_829633
直接链接到本评论
//www.tianjin-qmedu.com/matlabcentral/answers/518620-merge-or-join-two-data-sets#comment_829633
直接链接到本评论
//www.tianjin-qmedu.com/matlabcentral/answers/518620-merge-or-join-two-data-sets#comment_829739
直接链接到本评论
//www.tianjin-qmedu.com/matlabcentral/answers/518620-merge-or-join-two-data-sets#comment_829739
登录发表评论。