主要内容

fasttextwordembeddings.

普里德雷特FastText Word嵌入

描述

例子

胚胎= fasttextwordembeddings.返回一个300维的预先训练的嵌入100万个英语单词的单词。

此功能需要Text Analytics Toolbox™模型对于FastText英语160亿令牌嵌入万博1manbetx支持包。如果未安装此支持万博1manbetx包,则该函数提供了下载链接。

例子

全部收缩

下载并安装文本分析工具箱模型对于FastText英语160亿令牌嵌入万博1manbetx支持包。

类型fasttextwordembeddings.在命令行。

fasttextwordembeddings.

如果是文本分析工具箱模型对于FastText英语160亿令牌嵌入万博1manbetx如果没有安装支持包,则该函数将提供到Add-On Explorer中所需的支持包的链接。要安装支持包,请单击链接,然后万博1manbetx单击安装.输入以下命令,检查安装是否成功emb = fastTextWordEmbedding在命令行。

emb = fastTextWordEmbedding
emb = wordembeddings与属性:维度:300词汇:[1×1000000字符串]

如果安装了所需的支持包,则该函数万博1manbetx返回aWordembeddings.对象。

装载嵌入使用的预制单词fasttextwordembeddings..此功能需要文本分析工具箱™模型对于FastText英语160亿令牌嵌入万博1manbetx支持包。如果未安装此支持万博1manbetx包,则该函数提供了下载链接。

emb = fastTextWordEmbedding
emb = wordembeddings与属性:维度:300词汇:[1×1000000字符串]

把"意大利","罗马"和"巴黎"这三个词标到向量上Word2vec.

意大利= Word2vec(emb,“意大利”);罗马= word2vec (emb,“罗马”);巴黎= Word2Vec(emb,“巴黎”);

映射矢量意大利 - 罗马+巴黎用一个词vec2word.

Word = vec2word(emb,意大利 - 罗马+巴黎)
Word =“法国”

使用佩带的单词嵌入将一系列令牌文档转换为单词向量的序列。

使用使用的倒置的单词嵌入倒置的单词fasttextwordembeddings.功能。此功能需要文本分析工具箱™模型对于FastText英语160亿令牌嵌入万博1manbetx支持包。如果未安装此支持万博1manbetx包,则该函数提供了下载链接。

emb = fasttextwordembeddings;

加载出厂报告数据并创建一个tokenizedDocument大批。

filename =“factoryReports.csv”;数据= readtable(文件名,'texttype''细绳');textdata = data.description;文档= tokenizeddocument(textdata);

将文档转换为使用单词向量的序列doc2sequence..的doc2sequence.函数,默认情况下,左填充具有相同长度的序列。当使用高维词嵌入转换大型文档集合时,填充可能需要大量内存。为防止该函数填充数据,请设置'paddingdirection'选项'没有任何'.或者,您可以使用填充的数量“长度”选择。

序列= doc2sequence(mem,文件,'paddingdirection''没有任何');

查看前10个序列的大小。每个序列都是D.-经过-S.矩阵,D.是嵌入的维度,和S.是序列中的单词矢量的数量。

序列(1:10)
ANS =.10×1单元阵列{300×10单} {300×11单} {300×11单} {300×5单} {300×10单} {300×10单} {300×9单} {300×7单} {300×13单}

输出参数

全部收缩

倒置的单词嵌入,作为一个返回Wordembeddings.对象。

在R2018A介绍