fastTextWordEmbedding

预先训练的fastText词嵌入

折叠所有页面

语法

emb = fasttextwordembeddings.

描述

例子

循证= fastTextWordEmbedding返回嵌入100万英语单词的300维净化词。

此函数需要文本分析工具箱™模型用于快速文本英语160亿令牌词嵌入万博1manbetx支持包。如果没有安装此支万博1manbetx持包，该函数将提供下载链接。

例子

全部折叠

下载fastText支持包万博1manbetx

下载并安装文本分析工具箱模型用于快速文本英语160亿令牌词嵌入万博1manbetx支持包。

类型fastTextWordEmbedding在命令行。

fastTextWordEmbedding

如果文本分析工具箱模型用于快速文本英语160亿令牌词嵌入万博1manbetx不安装支持包，然后该函数提供了在附加资源管理器中的所需支持包的链接。要安装支持包，请单击“链接”，万博1manbetx然后单击安装．通过键入检查安装是否成功emb = fasttextwordembeddings.在命令行。

emb = fasttextwordembeddings.

emb = wordem寝具属性:Dimension: 300 Vocabulary: [1×1000000 string]

如果安装了所需的支持包，则该函数万博1manbetx返回awordEmbedding目的。

将单词映射到向量并返回

打开生活的脚本

加载一个预先训练的词嵌入使用fastTextWordEmbedding．此功能需要文本分析工具箱™模型用于快速文本英语160亿令牌词嵌入万博1manbetx支持包。如果没有安装此支万博1manbetx持包，则该函数将提供下载链接。

emb = fasttextwordembeddings.

emb = wordem寝具属性:Dimension: 300 Vocabulary: [1×1000000 string]

用“意大利”，“罗马”和“巴黎”来映射使用word2vec．

意大利= word2vec (emb,“意大利”）;罗马= word2vec（emb，“罗马”）;巴黎= word2vec (emb,“巴黎”）;

地图矢量意大利-罗马+巴黎用一个词vec2word．

Word = vec2word(emb，意大利-罗马+巴黎)

词=“法国”

将文档转换为单词向量序列

打开生活的脚本

使用预先训练的单词嵌入，将标记化文档数组转换为单词向量序列。

加载一个预先训练的词嵌入使用fastTextWordEmbedding函数。此功能需要文本分析工具箱™模型用于快速文本英语160亿令牌词嵌入万博1manbetx支持包。如果没有安装此支万博1manbetx持包，则该函数将提供下载链接。

emb = fastTextWordEmbedding;

加载工厂报告数据并创建令人畏缩的鳕文数组中。

文件名=“factoryReports.csv”；data = readtable(文件名,“TextType”，“字符串”）;textData = data.Description;文件= tokenizedDocument (textData);

使用。将文档转换为单词向量序列doc2sequence．这doc2sequence函数，默认情况下，左填充具有相同长度的序列。当使用高维词嵌入转换大型文档集合时，填充可能需要大量内存。为防止该函数填充数据，请设置“PaddingDirection”选择“没有”．控件也可以控制填充的数量'长度'选项。

序列= doc2sequence (emb、文档“PaddingDirection”，“没有”）;

查看前10个序列的大小。每个序列D——- - - - - -年代矩阵，其中D嵌入维度是，和年代为序列中单词向量的个数。

序列（1:10）

ans =10×1个单元阵列{300×10单}{300×11单}{300×11单}{300×6单}{300×5单}{300×10单}{300×8单}{300×9单}{300×7单}{300×13单}

输出参数

全部折叠

`循证`-预先训练的词嵌入
`wordEmbedding`对象

预先训练的词嵌入，返回为wordEmbedding目的。

另请参阅

主题

介绍了R2018a

fastTextWordEmbedding

语法

描述

例子

下载fastText支持包万博1manbetx

将单词映射到向量并返回

将文档转换为单词向量序列

输出参数

`循证`-预先训练的词嵌入
`wordEmbedding`对象

另请参阅

主题

文本分析工具箱文档

万博1manbetx

入门文本分析在MATLAB

fastTextWordEmbedding

语法

描述

例子

下载fastText支持包万博1manbetx

将单词映射到向量并返回

将文档转换为单词向量序列

输出参数

循证-预先训练的词嵌入wordEmbedding对象

另请参阅

主题

文本分析工具箱文档

万博1manbetx

入门文本分析在MATLAB

`循证`-预先训练的词嵌入
`wordEmbedding`对象