主要内容

addLemmaDetails

引理形式的标记添加到文档

自从R2018b

描述

使用addLemmaDetails引理的形式添加到文档。

函数支持英语、日本、和韩国万博1manbetx的文本。

例子

updatedDocuments= addLemmaDetails (文档)增加了引理细节文档并更新标记的细节。引理细节updatedDocuments,使用tokenDetails

例子

updatedDocuments= addLemmaDetails (文档“DiscardKnownValues”,真的)丢弃之前计算的细节和验算。

提示

使用addLemmaDetails在使用之前较低的,,normalizeWords函数作为addLemmaDetails这些函数使用的信息删除。

例子

全部折叠

创建一个标记化的文档数组。

str = [“狗追着猫。”“我是盖房子。”];文件= tokenizedDocument (str);

引理的细节添加到文档使用addLemmaDetails。这个函数lemmatizes引理并添加的文本形式的每个标记返回的表tokenDetails。查看更新后的令牌最初几个令牌的详细信息。

= addLemmaDetails文件(文档);tdetails = tokenDetails(文件);头(tdetails)
令牌DocumentNumber LineNumber类型语言引理是_____________ _____ ___________ ________ _________”“1 1字母在“的”“狗”1 1字母在“狗”“跑”1 1字母在“运行”后“1 1字母在“后”““1 1字母在“的”“猫”1 1字母在“猫”“。”1 1 punctuation en "." "I" 2 1 letters en "i"

输入参数

全部折叠

输入文件,指定为一个tokenizedDocument数组中。

输出参数

全部折叠

更新文件,作为一个返回tokenizedDocument数组中。获得令牌的细节updatedDocuments,使用tokenDetails

版本历史

介绍了R2018b