主要内容

removeInfrequentWords

从bag-of-words模型删除单词计数较低

描述

例子

newBag= removeInfrequentWords (,)删除出现最多的词次总从bag-of-words模型。这个函数,默认情况下,是区分大小写的。

例子

newBag= removeInfrequentWords (,“IgnoreCase”,真的)删除出现最多的词次总忽略的情况。如果单词只有不同情况,那么相应的合并。

例子

全部折叠

删除这句话从bag-of-words模型出现两次或更少。

从数组创建一个bag-of-words模型的标记化的文档。

文件= tokenizedDocument ([“一个短句”“第二个短句”“另一个例子”“一个简短的例子”]);袋= bagOfWords(文档)
袋= bagOfWords属性:计数:[4×8双]词汇:[“一”“例子”“”“”“短”“句子”“其次”“另一个”]NumWords: 8 NumDocuments: 4

删除这句话从bag-of-words模型出现两次或更少。

数= 2;newBag = removeInfrequentWords(包,数量)
newBag = bagOfWords属性:计数:[4 x3双]词汇:[“例子”“a”“短”]NumWords: 3 NumDocuments: 4

输入参数

全部折叠

输入bag-of-words模型,指定为一个bagOfWords对象。

计算阈值去除的话,指定为一个正整数。函数删除单词出现次或更少。

版本历史

介绍了R2017b