文档帮助中心
地图字嵌入矢量
M = word2vec(EMB,字)
M = word2vec(EMB,即, 'IGNORECASE',真)
例
中号= word2vec(EMB,话)返回的嵌入矢量话在嵌入EMB。如果一个字是不是在嵌入的词汇,那么函数返回的行为NaN秒。该功能默认情况下,区分大小写。
中号= word2vec(EMB,话)
中号
EMB
话
为NaN
中号= word2vec(EMB,话'IGNORECASE',真)返回的嵌入矢量话忽略大小写使用任何以前的语法。如果在嵌入多个词语的情况下,只不同,则该函数返回相应于它们中的一个矢量,并且不返回任何特定的载体。
中号= word2vec(EMB,话'IGNORECASE',真)
全部收缩
加载预训练字使用嵌入fastTextWordEmbedding。此功能需要文本分析工具箱™型号对于fastText英语16亿令牌字嵌入万博1manbetx支持包。如果未安装此支持万博1manbetx包,则该功能提供了下载链接。
fastTextWordEmbedding
EMB = fastTextWordEmbedding
EMB = wordEmbedding与性能:尺寸:300词汇:[1×百万字符串]
使用地图的话“意大利”,“罗马”和“巴黎”,以矢量word2vec。
word2vec
意大利= word2vec(EMB,“意大利”);罗马= word2vec(EMB,“罗马”);巴黎= word2vec(EMB,“巴黎”);
地图矢量意大利 - 罗马+巴黎一个字使用vec2word。
意大利 - 罗马+巴黎
vec2word
字= vec2word(EMB,意大利 - 罗马+巴黎)
字=“法国”
wordEmbedding
输入字嵌入,指定为wordEmbedding目的。
输入字,指定为字符串向量,特征向量,或字符向量的单元阵列。如果您指定话为字符向量,则该函数将参数作为一个单词。
数据类型:串|烧焦|细胞
串
烧焦
细胞
字嵌入矢量矩阵。
doc2sequence|fastTextWordEmbedding|isVocabularyWord|tokenizedDocument|vec2word|word2ind|wordEmbedding|wordEncoding
doc2sequence
isVocabularyWord
tokenizedDocument
word2ind
wordEncoding
这个例子的修改版本的系统上存在。你要打开这个版本呢?
您单击对应于该MATLAB命令的链接:
在MATLAB命令窗口中输入它运行的命令。Web浏览器不支持MATLAB的命令。万博1manbetx
选择一个网站,以获得翻译的内容,其中可看到当地的活动和优惠。根据您的位置,我们建议您选择:。
您还可以选择从下面的列表中的网站:
选择最佳的网站性能的中国网站(在中国或英文)。其他MathWorks的国家网站都没有从您的位置访问进行了优化。
请联系您当地的办事处