主要内容

删除词

문서에서불용어제거

설명

“ a”,“”,“ to”,“”,“”(불용어라고함)는에을할있습니다있습니다있습니다있습니다。분석전함수사용불용어불용어하십시오하십시오하십시오。

이함수,영어,일본어,독일어텍스트합니다합니다。다른언어에서删除词함수를하는방법을알아보려면언어고려사항항목을하십시오。

예제

新DOCUMENTS= removestopwords(文件象征性文档배열文件에서불용어제거합니다。기본적으로함수는文件의언어세부에따라停止字함수에서불용어목록사용/소문자소문자구분하지않습니다않습니다않습니다않습니다않습니다。

사용자지정목록을제거하려면删除字함수를합니다。

新DOCUMENTS= removestopwords(文件,“ ignorecase',false)停止字함수에된목록/소문자소문자가하는불용어합니다합니다합니다합니다。

删除词함수는归一化词함수에제거를사용하므로이를사용하기전에删除词함수를해야합니다。

예제

모두축소

문서로구성된에서删除词를사용불용어제거합니다。象征性文档함수는가영어인을감지하며따라서删除词는영어를합니다합니다。

documents = tokenizedDocument([“简短句子的例子”“第二句话”);newDocuments = removestopwords(文档)
newDocuments = 2x1 tokenizedDocument:3令牌:示例简短句子3令牌:第二个短句子

象征性文档를사용일본어를합니다합니다。이함수텍스트를으로합니다합니다합니다。

str = [“ここはな,とてもです”“”企业顾客をし,今年売り上げをことが出来。。。“私は。私英语を教えい。。”];文档= tokenizedDocument(str);

删除词를사용불용어제거합니다。이함수는文件의언어를하여어떤의불용어제거할지합니다합니다합니다。

文档= removestopwords(文档)
文档= 3x1 tokenizeddocument:4代币:静静とても10令牌:企业企业データ利用今年売り上げ调べる出来出来。。。。。。。。。。。。。。。。。。。。。。。。。。

象征性文档를사용독일어를합니다합니다。이함수텍스트를으로합니다합니다합니다。

str = [“ GutenMorgen。Wiegeht es dir?”“ heute wird ein guter标签。”];文档= tokenizedDocument(str)
文档= 2x1 tokenizedDocument:8代币:Guten Morgen。魏某geht ES目录 ?6个令牌:Heute Wird Ein Guter标签。

删除词함수를하여를합니다합니다。이함수의세부정보를하여어떤의를제거할지결정합니다합니다。

文档= removestopwords(文档)
文档= 2x1 tokenizedDocument:5代币:Guten Morgen。geht?5代币:Heute Wird Guter标签。

입력인수

모두축소

입력,象征性文档배열로됩니다。

출력인수

모두축소

출력,象征性文档배열로됩니다。

세부정보

모두축소

언어고려사항

停止字함수와删除词함수,영어,일본어,독일어불용어합니다합니다。

다른언어불용어를제거하려면删除字를사용할를직접해야합니다합니다。

알고리즘

모두축소

언어세부정보

象征性文档객체에는정보포함하여에대한정보가됩니다됩니다됩니다。입력문서언어세부정보따라따라删除词의동작달라집니다。象征性文档함수는으로텍스트의언어자동감지합니다합니다합니다。언어세부를수동으로하려면하려면象征性文档'语'이름-값값를하십시오하십시오。토큰세부정보보려면tokendetails함수를하십시오。

버전내역

R2018B에됨됨