主要内容

splitSentences

文本分割成句子

描述

例子

newStr= splitSentences (str)分裂str成一个数组的句子。

newDocuments= splitSentences (文档)将一个单一的tokenizedDocument对象到一个tokenizedDocument一系列的句子。

例子

全部折叠

从示例文件读课文sonnets.txt分割成句子。

文件名=“sonnets.txt”;str = extractFileText(文件名);句子= splitSentences (str);

查看前几句。

句子(1:10)
ans =10 x1字符串由威廉·莎士比亚《十四行诗》“”“我”“我们欲望增加,从美丽的生物……”"II" "When forty winters shall besiege thy brow,..." "How much more praise deserv'd thy beauty's use,..." "This were to be new made when thou art old,..." "III" "Look in thy glass and tell the face thou viewest..."

输入参数

全部折叠

输入文本,指定为字符串标量,特征向量,或一个标量单元阵列包含一个特征向量。

数据类型:字符串|字符|细胞

输入文档,指定为一个标量tokenizedDocument对象。

输出参数

全部折叠

输出文本,返回一个字符串数组或单元阵列的特征向量。

如果str是一个字符串,然后呢newStr是一个字符串。否则,newStr是一个单元阵列的特征向量。

数据类型:字符串|细胞

输出文件,作为一个返回tokenizedDocument数组中。

算法

如果表情符号或emoji字符出现后终止标点字符,那么函数将表情符号和emoji后的句子。

版本历史

介绍了R2018a