主要内容

删除InfrequentWords

字袋모델모델적은제거제거제거

설명

예제

新袋= removeinfrequentwords(,,,,数数tog tog tog tog에서최대数数번나오는를합니다합니다。이함수적/소문자소문자구분합니다합니다합니다。

예제

新袋= removeinfrequentwords(,,,,数数,“ ignorecase”,true)는/소문자소문자구분최대최대최대数数번나오는를합니다합니다。단어가/소문자소문자경우합산됩니다됩니다됩니다。

예제

모두축소

词袋2번번나오는단어합니다합니다합니다합니다。

to -w배열배열에서에서에서에서모델모델모델만듭니다만듭니다만듭니다。

documents = tokenizedDocument([“简短句子的例子”“第二句话”“另一个例子”“一个简短的例子”);bag = bagofwords(文档)
bag =带有属性的bagofword:counts:[4x8 double]词汇:[“ an”“示例” of“ a” a“ a”“ short” ...] numwords:8 numdocuments:4

词袋2번번나오는단어합니다합니다합니다합니다。

计数= 2;newbag = removeinfrequentwords(袋,计数)
newbag =带有属性的bagofword:counts:[4x3 double]词汇:[“示例”“ a”“ short”] numwords:3 numdocuments:4

입력인수

모두축소

입력词袋모델로,小词객체로됩니다。

단어제거개수값으로,양의지정됩니다됩니다。이함수는총数数번이하로단어제거합니다。

버전내역

R2017B에됨됨