主要内容

addTypeDetails

令牌类型的细节添加到文档

自从R2018b

描述

例子

updatedDocuments= addTypeDetails (文档)检测中的令牌类型文档并更新标记的细节。函数添加类型细节未知类型的令牌。获得令牌类型updatedDocuments,使用tokenDetails

例子

updatedDocuments= addTypeDetails (文档,名称,值)使用一个或多个指定附加选项名称-值对。

提示

使用addTypeDetails在使用之前较低的,,erasePunctuation函数作为addTypeDetails这些函数使用的信息删除。

例子

全部折叠

手动标记化的文本转换成一个tokenizedDocument对象,设置“TokenizeMethod”选项“没有”

str = [“对”“更多”“信息””、““看到”“//www.tianjin-qmedu.com”“。”];文件= tokenizedDocument (str,“TokenizeMethod”,“没有”)
文件= tokenizedDocument: 7令牌:有关更多信息,请参见//www.tianjin-qmedu.com。

视图使用令牌的细节tokenDetails函数。

tdetails = tokenDetails(文档)
tdetails =7×2表”牌DocumentNumber ___________________________ * * *“1”更“1“信息”1”,“1“看见”1“//www.tianjin-qmedu.com”1“。”1

如果你设置“TokenizeMethod”“没有”在调用tokenizedDocument函数,那么它不检测标记的类型。添加令牌类型细节,使用addTypeDetails函数。

= addTypeDetails文件(文档);

查看更新的令牌的详细信息。

tdetails = tokenDetails(文档)
tdetails =7×3表⒈牌DocumentNumber类型___________________________ * * *”“1字母“更多”1字母“信息”1信件”、“标点符号“看见”信“//www.tianjin-qmedu.com”1网址”。“1 punctuation

输入参数

全部折叠

输入文件,指定为一个tokenizedDocument数组中。

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:“TopLevelDomains”, (“com”“净”“org”]指定了顶级域名“com”、“净”、“org”网址检测。

顶级域名用于web地址检测、指定为一个特征向量,特征向量的字符串数组,数组或单元。

如果你不指定TopLevelDomains,那么这个函数使用的输出topLevelDomains函数。

例子:[" com”“净”“org”)

数据类型:字符|字符串|细胞

选择丢弃之前计算的细节和验算,指定为真正的

数据类型:逻辑

输出参数

全部折叠

更新文件,作为一个返回tokenizedDocument数组中。获得令牌的细节updatedDocuments,使用tokenDetails

版本历史

介绍了R2018b