文档帮助中心文档
从单词袋模型中删除低计数的单词
newBag = removeInfrequentWords(包,数量)
newBag = removeInfrequentWords(袋、计数、IgnoreCase,真的)
例子
newBag= removeInfrequentWords (袋,数)删除最多出现的单词数总时间从词袋模型袋。缺省情况下,区分大小写。
newBag= removeInfrequentWords (袋,数)
newBag
袋
数
newBag= removeInfrequentWords (袋,数“IgnoreCase”,真的)删除最多出现的单词数在完全忽略的情况下。如果单词只根据大小写不同,则相应的计数将合并。
newBag= removeInfrequentWords (袋,数“IgnoreCase”,真的)
全部折叠
从单词袋模型中删除出现两次或更少的单词。
从标记化文档数组创建词袋模型。
文件= tokenizedDocument (["一个短句的例子"“第二短句”“另一个例子”“一个简短的例子”]);袋= bagOfWords(文档)
count: [4x8 double] Vocabulary: [1x8 string] NumWords: 8 NumDocuments: 4
数= 2;newBag = removeInfrequentWords(包,数量)
newBag = bagOfWords with properties: Counts: [4x3 double] Vocabulary: ["example" "a" "short"] NumWords: 3 NumDocuments: 4
bagOfWords
输入单词袋模型,指定为bagOfWords对象。
删除单词的计数阈值,指定为正整数。函数删除出现的单词数总次数或更少的次数。
bagOfNgrams|bagOfWords|removeEmptyDocuments|removeInfrequentNgrams|removeWords|tfidf|tokenizedDocument|topkwords
bagOfNgrams
removeEmptyDocuments
removeInfrequentNgrams
removeWords
tfidf
tokenizedDocument
topkwords
您有这个示例的一个修改版本。要用编辑打开这个例子吗?
您点击了一个对应于这个MATLAB命令的链接:
通过在MATLAB命令窗口中输入该命令来运行该命令。Web浏览器不支持MATLAB命令。万博1manbetx
选择一个网站来获得可用的翻译内容,并看到当地的活动和提供。根据您所在的位置,我们建议您选择:。
你也可以从以下列表中选择一个网站:
请选择表现最佳的中国网站(中文或英文)。MathWorks的其他国家网站并没有针对您所在位置的访问进行优化。
与当地办事处联系