主要内容

删除程序

从令牌化文档阵列中删除空文档,文字袋模型或N-r克模型

描述

例子

新的模特=删除ydocuments(文件删除没有单词的文件文件

例子

新手=删除ydocuments(删除没有单词或n-克的文档或从单词袋或n克模型

例子

[___idx.] = RovemementyDocuments(___还返回删除文档的索引。

例子

全部收缩

删除包含令牌文档数组中没有单词的文档。

创建一个包含空文档的令牌化文档数组。

文档= tokenizeddocument([“一句话的一个例子”“第二句话”])
Documents = 4x1 TokenizedDocument:6个令牌:一个简短的句子0令牌:4令牌:第二个短句0令牌:

删除空文档。

newdocuments =删除文件(文件)
newdocuments = 2x1 tokenizeddocument:6个令牌:短句4令牌的一个例子:第二句话

删除包含袋式模型中没有单词的文档。

从令牌文档数组创建一个单词袋式模型。

文档= tokenizeddocument([“一句话的一个例子。”“第二句话。”]);BAG = BAGOFWORDS(文件)
BAG =具有属性的BagofWords:Counts:[4x9 Double]词汇:[1x9字符串] numwords:9 numfocuments:4

从单词袋式模型中删除空文档。

newbag = devicememptydocuments(袋)
newbag = bagofwords的属性:counts:[2x9 double]词汇:[1x9字符串] numwords:9 numfocuments:2

删除包含数组中没有单词的文档,并使用删除文档的索引还要删除相应的标签。

创建一个包含空文档的令牌化文档数组。

文档= tokenizeddocument([“一句话的一个例子”“第二句话”])
Documents = 4x1 TokenizedDocument:6个令牌:一个简短的句子0令牌:4令牌:第二个短句0令牌:

创建标签向量。

标签= [“t”;“F”;“F”;“t”]
标签=4x1字符串“t”“f”“f”“t”

删除空文档并获取删除文档的指数。

[newdocuments,idx] = rocemementydocuments(文件)
newdocuments = 2x1 tokenizeddocument:6个令牌:短句4令牌的一个例子:第二句话
Idx =.2×12 4.

删除相应的标签标签

标签(IDX)= []
标签=2x1字符串“t”“f”

输入参数

全部收缩

输入文档,指定为a令人畏缩的鳕文大批。

输入袋式袋或n-grams模型,指定为aBagofwords.对象或A.bagofngrams.目的。

输出参数

全部收缩

输出文件,作为a返回令人畏缩的鳕文大批。

输出模型,作为a返回Bagofwords.对象或A.bagofngrams.目的。类型的类型新手与类型相同

删除文件的指数,作为正整数的向量返回。

在R2017B中介绍