主要内容

removeShortWords

从文件或删除短词bag-of-words模型

描述

例子

newDocuments= removeShortWords (文档,len)删除单词的长度len或更少文档

例子

newBag= removeShortWords (,len)删除单词的长度len或更少的bagOfWords对象

例子

全部折叠

删除这句话有两个或更少的字符从一个文档。

文档= tokenizedDocument (“一个短句”);newDocument = removeShortWords(文档(2)
newDocument = tokenizedDocument: 3令牌:例子短句子

删除这句话有两个或更少的字符从bag-of-words模型。

文件= tokenizedDocument ([“一个短句”“第二个短句”]);袋= bagOfWords(文件);newBag = removeShortWords(袋、2)
newBag = bagOfWords属性:计数:[2 x4双]词汇:[“例子”“短”“句子”“第二”]NumWords: 4 NumDocuments: 2

输入参数

全部折叠

输入文件,指定为一个tokenizedDocument数组中。

输入bag-of-words模型,指定为一个bagOfWords对象。

最大长度的单词删除指定为一个正整数。该函数删除的话len或更少的字符。

输出参数

全部折叠

输出文件,作为一个返回tokenizedDocument数组中。

输出bag-of-words模型,作为一个返回bagOfWords对象。

版本历史

介绍了R2017b