主要内容

addTypeDetails

向文档添加令牌类型细节

描述

例子

updatedDocuments= addTypeDetails (文档中检测令牌类型文档并更新令牌细节。该函数只向类型未知的标记添加类型细节。来获取令牌类型updatedDocuments, 采用tokenDetails

例子

updatedDocuments= addTypeDetails (文档名称,值使用一个或多个名称-值对指定其他选项。

提示

使用addTypeDetails在使用之前较低的,erasePunctuation用作addTypeDetails使用被这些函数删除的信息。

例子

全部折叠

将手动标记文本转换为令人畏缩的鳕文对象,设置“TokenizeMethod”选择“没有”

str = [“为了”“更多”“信息”","“看到”“//www.tianjin-qmedu.com”“。”];文件= tokenizedDocument (str,“TokenizeMethod”“没有”
documents = tokenizedDocument: 7 token:更多信息,请参见//www.tianjin-qmedu.com。

属性查看令牌的详细信息tokenDetails函数。

tdetails = tokenDetails(文档)
Tdetails =7×2表令牌DocumentNumber  ___________________________ ______________ " “1”更多信息“1”“1”,“1”看到“1 " //www.tianjin-qmedu.com " 1 "。”1

如果你设置了“TokenizeMethod”“没有”在电话中令人畏缩的鳕文函数,则它不检测标记的类型。要添加令牌类型详细信息,请使用addTypeDetails函数。

文档= addtypedetails(文件);

查看更新后的令牌详细信息。

tdetails = tokenDetails(文档)
Tdetails =7×3表令牌DocumentNumber类型  ___________________________ ______________ ___________ " “1信”更“1字母”的信息“1字母”,“1标点”看到“1字母" //www.tianjin-qmedu.com " 1网址”。”1标点符号

输入参数

全部折叠

输入文档,指定为令人畏缩的鳕文数组中。

名称-值对的观点

指定可选的逗号分隔的对名称,值参数。的名字参数名和价值是相应的价值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数name1,value1,...,namen,valuen

例子:“TopLevelDomains”,(“com”“净”“org”]指定用于web地址检测的顶级域名“com”、“net”和“org”。

用于web地址检测的顶级域名,指定为字符向量、字符串数组或字符向量的单元格数组。

如果没有指定人持人群,然后该函数使用输出topLevelDomains函数。

例子:[" com”“净”“org”)

数据类型:字符|字符串|细胞

选择放弃先前计算的细节并重新计算它们,指定为真的要么

数据类型:逻辑

输出参数

全部折叠

更新的文档,返回为令人畏缩的鳕文数组中。获取令牌的详细信息updatedDocuments, 采用tokenDetails

介绍了R2018b