帮助中心帮助中心
从bag-of-words模型删除单词计数较低
newBag = removeInfrequentWords(包,数量)
newBag = removeInfrequentWords(袋、计数、IgnoreCase,真的)
例子
newBag= removeInfrequentWords (袋,数)删除出现最多的词数次总从bag-of-words模型袋。这个函数,默认情况下,是区分大小写的。
newBag= removeInfrequentWords (袋,数)
newBag
袋
数
newBag= removeInfrequentWords (袋,数“IgnoreCase”,真的)删除出现最多的词数次总忽略的情况。如果单词只有不同情况,那么相应的合并。
newBag= removeInfrequentWords (袋,数“IgnoreCase”,真的)
全部折叠
删除这句话从bag-of-words模型出现两次或更少。
从数组创建一个bag-of-words模型的标记化的文档。
文件= tokenizedDocument ([“一个短句”“第二个短句”“另一个例子”“一个简短的例子”]);袋= bagOfWords(文档)
袋= bagOfWords属性:计数:[4×8双]词汇:[“一”“例子”“”“”“短”“句子”“其次”“另一个”]NumWords: 8 NumDocuments: 4
数= 2;newBag = removeInfrequentWords(包,数量)
newBag = bagOfWords属性:计数:[4 x3双]词汇:[“例子”“a”“短”]NumWords: 3 NumDocuments: 4
bagOfWords
输入bag-of-words模型,指定为一个bagOfWords对象。
计算阈值去除的话,指定为一个正整数。函数删除单词出现数次或更少。
介绍了R2017b
bagOfWords|bagOfNgrams|removeInfrequentNgrams|removeWords|removeEmptyDocuments|topkwords|tfidf|tokenizedDocument
bagOfNgrams
removeInfrequentNgrams
removeWords
removeEmptyDocuments
topkwords
tfidf
tokenizedDocument
这种版本modificada德埃斯特比如。害怕Desea abrir埃斯特比如con sus modificaciones吗?
Ha事实clic en联合国围绕此时一个埃斯特第一de MATLAB:
Ejecute el第一introduciendolo en la ventana de第一de MATLAB。洛杉矶navegadores网络没有admiten第一de MATLAB。
选择一个网站
选择一个网站翻译内容,看到当地事件和提供。根据你的位置,我们建议您选择:。
你也可以从下面的列表中选择一个网站:
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。
联系你当地的办公室