主要内容

removeshortwords.

从文档或单词袋式模型中删除短单词

描述

例子

新的模特= removeshortwords(文件Len.去除长度的话Len.或更少文件

例子

新手= removeshortwords(Len.去除长度的话Len.或更少Bagofwords.目的

例子

全部收缩

从文档中删除具有两个或更少字符的单词。

Document = TokenizedDocument(“一句话的一个例子”);newdocument = removeshortwords(文件,2)
newdocument = tokenizeddocument:3令牌:示例简短句子

从单词袋式模型中删除具有两个或更少字符的单词。

文档= tokenizeddocument([......“一句话的一个例子”“第二句话”]);bag = bagofwords(文件);newbag = removeshortwords(袋子,2)
newbag = bagofwords的属性:counts:[2x4 double]词汇:[示例“”短“”句子“”第二“] numwords:4 numfocuments:2

输入参数

全部收缩

输入文档,指定为a令人畏缩的鳕文大批。

输入袋式模型,指定为aBagofwords.目的。

要删除的最大单词长度,指定为正整数。该功能删除了单词Len.或更少的角色。

输出参数

全部收缩

输出文件,作为a返回令人畏缩的鳕文大批。

输出袋式模型,作为一个返回Bagofwords.目的。

在R2017B中介绍