加入

组合多个bag-of-words或bag-of-n-grams模型

折叠所有页面

语法

newBag =加入(袋)

newBag =加入(袋、暗)

描述

例子

newBag=加入(袋）组合数组中的元素袋通过合并频率计数。该函数将第一维不等于1的元素组合起来。

newBag=加入(袋，昏暗的）组合数组中的元素袋沿着维度昏暗的．

例子

全部折叠

结合Bag-of-Words模型

打开生活的脚本

从标记化的文档中创建一个由两个词袋模型组成的数组。

str = [．..一个短句的例子第二个短句];文件= tokenizedDocument (str);袋(1)= bagOfWords(文档(1));袋(2)= bagOfWords(文档(2))

袋=1×2对象带有属性的1x2 bagOfWords数组:计数词汇量NumWords NumDocuments

结合单词袋模型使用加入．

袋=加入(袋)

bag = bagOfWords with properties: Counts: [2x7 double]NumWords: 7 NumDocuments: 2

并行创建词袋模型

打开生活的脚本

如果您的文本数据包含在一个文件夹中的多个文件中，那么您可以导入文本数据并使用并行创建单词包模型parfor．如果您安装了并行计算工具箱™，则parfor循环以并行方式运行，否则，它以串行方式运行。使用加入将一组词汇袋模型组合成一个模型。

从文件集合创建单词袋模型。示例十四行诗有文件名"exampleSonnetN.txt”,N是十四行诗的编号。获取文件的列表和他们的位置使用dir．

fileLocation = fullfile (matlabroot,“例子”，“textanalytics”，“exampleSonnet * . txt”）;fileInfo = dir (fileLocation)

fileInfo = 0x1带有字段的空结构数组:name folder date bytes isdir datenum

初始化一个空的单词包模型，然后循环遍历这些文件并创建一个单词包模型数组。

袋= bagOfWords;numFiles =元素个数(fileInfo);parfori = 1:numFiles f = fileInfo(i);文件名= fullfile (f.folder f.name);textData = extractFileText(文件名);文档= tokenizedDocument (textData);袋(我)= bagOfWords(文档);结束

结合单词袋模型使用加入．

袋=加入(袋)

bag = bagOfWords with properties: Counts: [] Vocabulary: [1x0 string] NumWords: 0 NumDocuments: 0

输入参数

全部折叠

`袋`- - - - - -bag-of-words或bag-of-n-grams模型数组
`bagOfWords`数组|`bagOfNgrams`数组

包-单词或包-n-grams模型的数组，指定为bagOfWords数组或一个bagOfNgrams数组中。如果袋是一个bagOfNgrams的值，则要连接的每个元素必须具有相同的NgramLengths财产。

`昏暗的`- - - - - -连接模型的维度
正整数

连接模型的维度，指定为正整数。如果昏暗的，则默认为大小不等于1的第一个维度。

输出参数

全部折叠

`newBag`——输出模型
`bagOfWords`数组|`bagOfNgrams`数组

输出模型，作为bagOfWords对象或一个bagOfNgrams对象。的类型newBag是同类型的吗袋．newBag具有与输入模型相同的数据类型，并且在被连接的维度上的大小为1。

另请参阅

主题

介绍了R2018a

加入

语法

描述

例子

结合Bag-of-Words模型

并行创建词袋模型

输入参数

`袋`- - - - - -bag-of-words或bag-of-n-grams模型数组
`bagOfWords`数组|`bagOfNgrams`数组

`昏暗的`- - - - - -连接模型的维度
正整数

输出参数

`newBag`——输出模型
`bagOfWords`数组|`bagOfNgrams`数组

另请参阅

主题

文本分析工具箱文档

万博1manbetx

入门文本分析在MATLAB

加入

语法

描述

例子

结合Bag-of-Words模型

并行创建词袋模型

输入参数

袋- - - - - -bag-of-words或bag-of-n-grams模型数组bagOfWords数组|bagOfNgrams数组

昏暗的- - - - - -连接模型的维度正整数

输出参数

newBag——输出模型bagOfWords数组|bagOfNgrams数组

另请参阅

主题

文本分析工具箱文档

万博1manbetx

入门文本分析在MATLAB

`袋`- - - - - -bag-of-words或bag-of-n-grams模型数组
`bagOfWords`数组|`bagOfNgrams`数组

`昏暗的`- - - - - -连接模型的维度
正整数

`newBag`——输出模型
`bagOfWords`数组|`bagOfNgrams`数组