要查找来自高维文本数据集的集群和提取功能,您可以使用机器学习技术和模型,如LSA,LDA和Word Embeddings。您可以将使用Text Analytics Toolbox™创建的功能组合,其中包含其他数据源的功能。使用这些功能,您可以构建机器学习模型,以利用文本,数字和其他类型的数据。
这个例子展示了如何创建一个函数来清理和预处理文本数据以进行分析。
此示例显示如何使用袋式模型训练字频计上的简单文本分类器。
这个例子展示了如何使用n-gram频率计数来分析文本。
这个示例展示了如何使用Latent Dirichlet Allocation (LDA)主题模型来分析文本数据。
此示例显示了如何确定潜在Dirichlet分配(LDA)模型的适当数量的主题。
这个例子展示了如何通过比较模型的拟合优度和拟合时间来比较潜在的Dirichlet分配(LDA)求解器。
此示例显示如何使用潜在的Dirichlet分配(LDA)主题模型和T-SNE图来可视化文档的群集。
这个示例展示了如何在Latent Dirichlet Allocation (LDA)主题模型中分析主题之间的相关性。
此示例显示如何适合潜在的Dirichlet分配(LDA)主题模型并在LDA主题和文档标签之间可视化相关性。
这个例子展示了如何使用单词袋模型创建一个共现网络。
此示例显示了如何使用价值感知词典和情绪推理(VADER)算法进行情感分析。
这个例子展示了如何使用10-K和10-Q财务报告生成情感分析的词典。
此示例显示如何使用正面和负面情绪单词的注释列表和佩戴尔嵌入的单词嵌入的注释列表来训练分类器进行情感分析。
此示例显示如何使用快速自动关键字提取(Rake)从文本数据中提取关键字。
这个例子展示了如何使用TextRank从文本数据中提取关键字。
此示例显示如何使用深度学习长期短期内存(LSTM)网络对文本数据进行分类。
此示例显示如何使用卷积神经网络对文本数据进行分类。
此示例显示如何使用变换的数据存储来将内存外文本数据分类为深入学习网络。
这个示例演示了如何使用循环序列到序列编码器-解码器模型将十进制字符串转换为罗马数字。
此示例显示如何对具有多个独立标签的文本数据进行分类。
使用深度学习生成文本(深度学习工具箱)
这个例子展示了如何训练深度学习长短期记忆(LSTM)网络生成文本。
此示例显示如何使用字符嵌入式培训深度学习LSTM网络来生成文本。
这个例子展示了如何训练一个深度学习LSTM网络来逐字生成文本。
这个例子展示了如何使用带有自定义训练循环的深度学习双向长短期记忆(BiLSTM)网络对文本数据进行分类。
这个例子展示了如何使用自动编码器生成文本数据。
此示例显示如何定义文本编码器模型函数。
此示例显示如何定义文本解码器模型函数。
这个例子展示了如何使用循环序列到序列编码器-解码器模型来训练德语到英语的翻译人员。
有关使用其他语言的文本分析工具箱功能的信息。
关于文本分析工具箱中的日语支持的信息。万博1manbetx
此示例显示了如何使用主题模型导入,准备和分析日语文本数据。
文本分析工具箱中德语支持的信息。万博1manbetx
此示例显示了如何使用主题模型导入,准备和分析德语文本数据。