文件帮助中心文件
删除标点符号
从文本和文档中擦除标点符号
newstr =侵蚀(str)
newdocuments =侵蚀(文件)
newDocuments=删除标点符号(文档、'TokenTypes',类型)
例子
新闻=侵蚀(str.)从元素中删除标点符号和符号str.。该函数删除属于Unicode标点符号或符号类的字符。
新闻=侵蚀(str.)
新闻
str.
新的模特=侵蚀(文件)从中删除标点符号和符号文件。如果在删除标点符号和符号字符后,则单词是空的,则该功能会删除它。对于令牌化文档输入,该函数删除与类型的令牌标点'标点'和'其他'。例如,该函数不会从URL和电子邮件地址删除标点符号和符号字符。
新的模特=侵蚀(文件)
新的模特
文件
'标点'
'其他'
新的模特=侵蚀(文件,'tokentypes',类型)仅从指定的标记类型中删除标点和符号。
新的模特=侵蚀(文件,'tokentypes',类型)
类型
全部崩溃
从文本中删除标点符号str.。
str =“这是一个和/或两个。”;newstr =侵蚀(str)
newstr =“它的一个Andor两个”
插入一个空间"/"符号是,首先使用代替功能。
"/"
代替
newstr =替换(str,"/"那" ")
newStr=“是一加二。”
Newstr =侵蚀(Newstr)
newStr=“它是一个或两个”
删除文档数组中的标点符号。
文档= tokenizeddocument([......“一个短句的例子。”“另一个例子......带有URL://www.tianjin-qmedu.com”])
文档= 2x1令牌设备:7个令牌:短句的一个例子。10令牌:另一个例子。。。使用URL://www.tianjin-qmedu.com
newdocuments = 2x1 tokenizeddocument:6个令牌:短句6令牌的示例:另一个例子,带有URL //www.tianjin-qmedu.com
这里,该函数不会从URL删除标点符号。
输入文本,指定为字符串数组、字符向量或字符向量的单元格数组。
例子:[“短句的一个例子。”;“第二句话。”]
[“短句的一个例子。”;“第二句话。”]
数据类型:细绳|烧焦|单间牢房
细绳
烧焦
单间牢房
标记化文档
输入文档,指定为a标记化文档大批。
{‘标点符号’,‘其他’}
令牌类型以擦除标点符号,指定为字符向量,字符串阵列或包含一个或多个令牌类型(包括自定义令牌类型)的字符向量的小区数组。
这标记化文档和addTypeDetails函数自动检测以下令牌类型:
addTypeDetails
'字母'- 仅限字符串字符串
'字母'
“数字”- 仅限位数
“数字”
'标点'- 仅标点符号和符号字符
'电子邮件地址'–检测到的电子邮件地址
'电子邮件地址'
“网址”- 检测到的Web地址
“网址”
'井号'–检测到的标签(以“#”字符后跟字母)
'井号'
“#”
“提及时”- 检测到提及(从"@"特点)
“提及时”
"@"
'表情'- 检测到的表情符号
'表情'
'emoji'–检测到的表情符号
'emoji'
'其他'–不属于以前的类型,也不是自定义类型
要在标记化时指定自己的自定义标记类型,请使用'CustomTokens'或“常规表达”选项标记化文档. 如果未指定自定义令牌的类型,则软件会将相应的令牌类型设置为'风俗'。
'CustomTokens'
“常规表达”
'风俗'
输出文本,返回为字符串数组,字符向量或字符向量的单元格数组。str.和新闻具有相同的数据类型。
输出文件,作为a返回标记化文档大批。
每个Unicode字符都被分配了一个类别。下表总结了Unicode标点符号和符号类别,并提供每个类别的示例字符:
有关详细信息,请参阅[1]。
对于字符串输入,删除标点符号从URL和HTML标记中删除标点符号。此行为可能会阻止擦除标签那eraseulls.和解码码从预期工作。如果要使用这些函数来预处理您的文本,请在使用前使用这些功能删除标点符号。
擦除标签
eraseulls.
解码码
展开全部
R2018B的行为更改
从R2018B开始,为标记化文档输入,删除标点符号默认情况下,将从具有类型的标记中删除标点符号和符号字符'标点'或'其他'仅限。此行为防止函数影响复杂标记,如URL和电子邮件地址。
在以前的版本中,删除标点符号从所有标记中删除标点符号。要复制该行为,请使用'tokentypes'名称值对。
'tokentypes'
[1]Unicode字符类别。https://www.fileformat.info/info/unicode/category/index.htm.
解码码|擦除标签|eraseulls.|降低|标记化文档|上
降低
上
您有此示例的修改版本。您是否希望使用您的编辑打开此示例?
您单击了与此MATLAB命令对应的链接:
在MATLAB命令窗口中输入它来运行命令。Web浏览器不支持MATLAB命令。万博1manbetx
选择一个网站,以便在可用的地方进行翻译的内容,并查看本地活动和优惠。根据您的位置,我们建议您选择:。
您还可以从以下列表中选择网站:
选择中国网站(以中文或英文)以获取最佳网站性能。其他MathWorks国家网站未优化您的位置。
联系当地办事处