主要内容

replaceNgrams

在文档中替换字格

自从R2019a

描述

例子

newDocuments= replaceNgrams (文档,oldNgrams,newNgrams)更新指定的文件代替字格oldNgrams与相应的字格newNgrams。这个函数,默认情况下,是区分大小写的。

newDocuments= replaceNgrams (文档,oldNgrams,newNgrams“IgnoreCase”,真的)取代了字格oldNgrams忽略的情况。

例子

全部折叠

使用replaceNgrams函数把缩写换成相应的扩展形式。

创建一个数组的标记化的文档。

str = [“目前在剑桥,妈。”“下一站,纽约!”];文件= tokenizedDocument (str)
文件= 2 x1 tokenizedDocument: 6令牌:目前在剑桥,马。5令牌:下一站,纽约!

更换令牌“马”“纽约”“麻省”(“新”“纽约”)分别。如果字格有不同的长度,必须垫与空字符串的行”“。在这种情况下,您必须垫“麻省”用一个空字符串”“

oldNgrams = [“马”“纽约”];newNgrams = [“麻省””““新”“纽约”];= replaceNgrams文档(文档、oldNgrams newNgrams)
文件= 2 x1 tokenizedDocument: 6令牌:目前在剑桥,麻萨诸塞州。6代币:下一站,纽约!

输入参数

全部折叠

输入文件,指定为一个tokenizedDocument数组中。

字格来取代,指定为字符串数组,特征向量,或一个单元阵列的特征向量。

如果oldNgrams是一个字符串数组或单元阵列,那么它的尺寸吗NumNgrams——- - - - - -maxN,在那里NumNgrams字格的数量,maxN的长度是最大的语法。如果oldNgrams是一个特征向量,那么它代表一个词(unigram)。

的价值oldNgrams (i, j)jth的话语法。如果单词的数量语法小于maxN,然后剩下的条目th排oldNgrams空字符串必须垫吗”“

例如,指定unigram“麻省”,三元(“新”“纽约”),指定2×2的字符串数组(“麻省”””;“新”“纽约”),在那里“麻省”带一个空字符串吗”“

数据类型:字符串|字符|细胞

新字格,指定为一个字符串数组,特征向量,或一个单元阵列的特征向量。

如果newNgrams是一个字符串数组或单元阵列,那么它的尺寸吗NumNgrams——- - - - - -maxN,在那里NumNgrams字格的数量,maxN的长度是最大的语法。如果newNgrams是一个特征向量,那么它代表一个词(unigram)。

的价值newNgrams (i, j)jth的话语法。如果单词的数量语法小于maxN,然后剩下的条目th排newNgrams是空的。

newNgrams必须有一行,还是一样的行数oldNgrams

例如,指定unigram“麻省”,三元(“新”“纽约”),指定2×2的字符串数组(“麻省”””;“新”“纽约”),在那里“麻省”带一个空字符串吗”“

数据类型:字符串|字符|细胞

输出参数

全部折叠

输出文件,作为一个返回tokenizedDocument数组中。

版本历史

介绍了R2019a