文档帮助中心文档
预先训练的fastText词嵌入
emb = fasttextwordembeddings.
例子
循证= fastTextWordEmbedding返回嵌入100万英语单词的300维净化词。
循证= fastTextWordEmbedding
循证
此函数需要文本分析工具箱™模型用于快速文本英语160亿令牌词嵌入万博1manbetx支持包。如果没有安装此支万博1manbetx持包,该函数将提供下载链接。
全部折叠
下载并安装文本分析工具箱模型用于快速文本英语160亿令牌词嵌入万博1manbetx支持包。
类型fastTextWordEmbedding在命令行。
fastTextWordEmbedding
如果文本分析工具箱模型用于快速文本英语160亿令牌词嵌入万博1manbetx不安装支持包,然后该函数提供了在附加资源管理器中的所需支持包的链接。要安装支持包,请单击“链接”,万博1manbetx然后单击安装.通过键入检查安装是否成功emb = fasttextwordembeddings.在命令行。
emb = wordem寝具属性:Dimension: 300 Vocabulary: [1×1000000 string]
如果安装了所需的支持包,则该函数万博1manbetx返回awordEmbedding目的。
wordEmbedding
加载一个预先训练的词嵌入使用fastTextWordEmbedding.此功能需要文本分析工具箱™模型用于快速文本英语160亿令牌词嵌入万博1manbetx支持包。如果没有安装此支万博1manbetx持包,则该函数将提供下载链接。
用“意大利”,“罗马”和“巴黎”来映射使用word2vec.
word2vec
意大利= word2vec (emb,“意大利”);罗马= word2vec(emb,“罗马”);巴黎= word2vec (emb,“巴黎”);
地图矢量意大利-罗马+巴黎用一个词vec2word.
意大利-罗马+巴黎
vec2word
Word = vec2word(emb,意大利-罗马+巴黎)
词=“法国”
使用预先训练的单词嵌入,将标记化文档数组转换为单词向量序列。
加载一个预先训练的词嵌入使用fastTextWordEmbedding函数。此功能需要文本分析工具箱™模型用于快速文本英语160亿令牌词嵌入万博1manbetx支持包。如果没有安装此支万博1manbetx持包,则该函数将提供下载链接。
emb = fastTextWordEmbedding;
加载工厂报告数据并创建令人畏缩的鳕文数组中。
令人畏缩的鳕文
文件名=“factoryReports.csv”;data = readtable(文件名,“TextType”,“字符串”);textData = data.Description;文件= tokenizedDocument (textData);
使用。将文档转换为单词向量序列doc2sequence.这doc2sequence函数,默认情况下,左填充具有相同长度的序列。当使用高维词嵌入转换大型文档集合时,填充可能需要大量内存。为防止该函数填充数据,请设置“PaddingDirection”选择“没有”.控件也可以控制填充的数量'长度'选项。
doc2sequence
“PaddingDirection”
“没有”
'长度'
序列= doc2sequence (emb、文档“PaddingDirection”,“没有”);
查看前10个序列的大小。每个序列D——- - - - - -年代矩阵,其中D嵌入维度是,和年代为序列中单词向量的个数。
序列(1:10)
ans =10×1个单元阵列{300×10单}{300×11单}{300×11单}{300×6单}{300×5单}{300×10单}{300×8单}{300×9单}{300×7单}{300×13单}
预先训练的词嵌入,返回为wordEmbedding目的。
doc2sequence|IsVocabularyWord.|readWordEmbedding|令人畏缩的鳕文|trainWordEmbedding|vec2word|word2vec|wordEmbedding|wordEmbeddingLayer|wordEncoding
IsVocabularyWord.
readWordEmbedding
trainWordEmbedding
wordEmbeddingLayer
wordEncoding
您有这个示例的修改版本。您想打开这个示例与您的编辑吗?
你点击一个链接对应于这个MATLAB命令:
通过在MATLAB命令窗口中输入命令来运行命令。Web浏览器不支持MATLAB命令。万博1manbetx
选择一个网站,在那里获得翻译的内容,并看到当地的活动和优惠。根据您的位置,我们建议您选择:.
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。
与当地办事处联系