主要内容

wordCloudCounts

计算单词云创建的单词数

描述

例子

T= wordCloudCounts (str标记和预处理的文本str用于创建字云,并返回一个表T单词和频率计数。该函数支持英语、日语、德语万博1manbetx和韩语文本。

例子

全部折叠

将文本从sonnets.txt使用extractFileText

str = extractFileText (“sonnets.txt”);

看第一首十四行诗。

我= strfind (str,“我”);2 = strfind (str,“二世”);=我开始(1);鳍= 2 (1);extractBetween (str,开始,fin-1)
我们希望从最美丽的生灵中生长,这样美之玫瑰就永远不会凋谢,但正如成熟的玫瑰会随着时间的流逝而凋谢,他的娇嫩的继承人也会记住他:可是你,只盯着自己明亮的眼睛,把自己的物质燃料填满你的火焰,把富足的地方变成饥荒,把你自己当作敌人,把你可爱的自己弄得太残酷:你现在是这世界的新鲜的装饰品,是这绚丽春天的唯一使者,把你的满足埋在你的花蕾里,温柔的粗人把你的吝啬浪费掉:可怜这世界吧,否则这个贪吃的人,要用坟墓和你来吃掉这世界的本分。”

对十四行诗文本进行标记和预处理,并创建一个单词频率计数表。

T = wordCloudCounts (str);头(T)
ans =8×2表词数______ _____ "你的" 281 "你" 235 "爱" 188 "你" 162 "眼睛" 90 "做" 88 "使" 63 "我的" 63

输入参数

全部折叠

输入文本,指定为字符串数组、字符向量或字符向量的单元格数组。

对于字符串输入,wordcloudwordCloudCounts函数使用英语、日语、德语和韩语标记化、停止单词删除和单词规范化。

例子:["一个短文档的例子";"第二个短文档"]

数据类型:字符串|字符|细胞

输出参数

全部折叠

按重要性排序的单词计数表。表有列:

字符串标量词。
该词在文档中出现的次数。函数将只根据大小写不同或有共同词干的单词计数分组normalizeWords.例如,函数将“walk”、“Walking”、“Walking”和“walks”的计数分组。

更多关于

全部折叠

语言的注意事项

对于字符串输入,wordcloudwordCloudCounts函数使用英语、日语、德语和韩语标记化、停止单词删除和单词规范化。

介绍了R2017b