splitSentences

文本分割成句子

所有的页面崩溃

语法

newStr = splitSentences (str)

newDocuments = splitSentences(文档)

描述

例子

newStr= splitSentences (str)分裂str成一个数组的句子。

newDocuments= splitSentences (文档)将一个单一的tokenizedDocument对象到一个tokenizedDocument一系列的句子。

例子

全部折叠

文本分割成句子

打开生活的脚本

从示例文件读课文sonnets.txt分割成句子。

文件名=“sonnets.txt”;str = extractFileText(文件名);句子= splitSentences (str);

查看前几句。

句子(1:10)

ans =10 x1字符串由威廉·莎士比亚《十四行诗》“”“我”“我们欲望增加,从美丽的生物……”"II" "When forty winters shall besiege thy brow,..." "How much more praise deserv'd thy beauty's use,..." "This were to be new made when thou art old,..." "III" "Look in thy glass and tell the face thou viewest..."

输入参数

全部折叠

`str`- - - - - -输入文本
字符串标量|特征向量|标量单元阵列包含一个特征向量

输入文本,指定为字符串标量,特征向量,或一个标量单元阵列包含一个特征向量。

数据类型:字符串|字符|细胞

`文档`- - - - - -输入文档
标量`tokenizedDocument`对象

输入文档,指定为一个标量tokenizedDocument对象。

输出参数

全部折叠

`newStr`——输出文本
字符串数组|单元阵列的特征向量

输出文本,返回一个字符串数组或单元阵列的特征向量。

如果str是一个字符串,然后呢newStr是一个字符串。否则,newStr是一个单元阵列的特征向量。

数据类型:字符串|细胞

`newDocuments`——输出文档
`tokenizedDocument`数组

输出文件,作为一个返回tokenizedDocument数组中。

算法

如果表情符号或emoji字符出现后终止标点字符,那么函数将表情符号和emoji后的句子。

版本历史

介绍了R2018a

另请参阅

splitSentences

语法

描述

例子

文本分割成句子

输入参数

str- - - - - -输入文本字符串标量|特征向量|标量单元阵列包含一个特征向量

文档- - - - - -输入文档标量tokenizedDocument对象

输出参数

newStr——输出文本字符串数组|单元阵列的特征向量

newDocuments——输出文档tokenizedDocument数组

算法

版本历史

另请参阅

主题

`str`- - - - - -输入文本
字符串标量|特征向量|标量单元阵列包含一个特征向量

`文档`- - - - - -输入文档
标量`tokenizedDocument`对象

`newStr`——输出文本
字符串数组|单元阵列的特征向量

`newDocuments`——输出文档
`tokenizedDocument`数组