erasePunctuation
从文本和文档删除标点符号
语法
描述
擦除标点和符号newDocuments
= erasePunctuation (文档
)文档
。如果一个单词是空的之后删除标点和符号字符,然后删除它的函数。标记文档输入、擦除标点符号从令牌类型的函数“标点符号”
和“其他”
。例如,函数不擦掉标点和符号字符从网址和电子邮件地址。
擦除标点和符号只有指定的令牌类型。newDocuments
= erasePunctuation (文档
“TokenTypes”,类型
)
例子
输入参数
输出参数
更多关于
提示
字符串输入,
erasePunctuation
从url和HTML标记删除标点符号。这种行为可以预防的功能eraseTags
,eraseURLs
,decodeHTMLEntities
从按预期工作。如果您想要使用这些函数来对文本进行预处理,然后利用这些函数在使用erasePunctuation
。
引用
[1]Unicode字符类别。https://www.fileformat.info/info/unicode/category/index.htm