从文档中删除停止词
像“a”、“and”、“to”和“the”这样的词(被称为停止词)会给数据增加噪音。使用此函数在分析前删除停止词。
支持英文、日文、德文、韩文万博1manbetx文本。学习如何使用removeStopWords
对于其他语言,请参阅语言的注意事项.
将停止词从newDocuments
= removeStopWords (文档
)tokenizedDocument
数组文档
.函数在默认情况下使用stopWords
功能根据语言的细节文档
并且不区分大小写。
若要删除自定义单词列表,请使用removeWords
函数。
删除大小写匹配的停止词列表newDocuments
= removeStopWords (文档
、“IgnoreCase”错误)stopWords
函数。
提示
使用removeStopWords
在使用之前normalizeWords
函数作为removeStopWords
使用该函数删除的信息。
bagOfWords
|normalizeWords
|removeLongWords
|removeShortWords
|removeWords
|stopWords
|tokenizedDocument