建模和预测
要查找高维文本数据集中的簇和提取功能,您可以使用机器学习技术和模型,例如LSA,LDA和Word Embeddings。您可以将创建的功能与Text Analytics Toolbox™与其他数据源的功能相结合。有了这些功能,您可以构建利用文本,数字和其他类型数据的机器学习模型。
功能
话题
分类和建模
此示例显示了如何创建一个清洁和预处理文本数据以进行分析的函数。
此示例显示了如何使用单词范围模型在单词频率计数上训练简单的文本分类器。
此示例显示了如何使用n-gram频率计数分析文本。
此示例显示了如何使用潜在的Dirichlet分配(LDA)主题模型来分析文本数据。
此示例显示了如何确定潜在Dirichlet分配(LDA)模型的合适数量的主题。
此示例显示了如何通过比较拟合度的优点和适合模型所花费的时间来比较潜在的dirichlet分配(LDA)求解器。
此示例显示了如何使用潜在的Dirichlet分配(LDA)主题模型和T-SNE图可视化文档的聚类。
此示例显示了如何在潜在的Dirichlet分配(LDA)主题模型中分析主题之间的相关性。
此示例显示了如何拟合潜在的Dirichlet分配(LDA)主题模型,并可视化LDA主题和文档标签之间的相关性。
此示例显示了如何使用单词范围的模型创建共同发生网络。
情感分析和关键字提取
此示例显示了如何使用Valence Aware Away词典和情感推理器(Vader)算法进行情感分析。
此示例显示了如何使用10-K和10-Q财务报告生成词典来进行情感分析。
此示例显示了如何使用正面和负面情感单词的注释列表和审计的单词嵌入来训练分类器进行情感分析。
此示例显示了如何使用快速自动关键字提取(Rake)从文本数据中提取关键字。
此示例显示了使用Textrank从文本数据中提取关键字。
深度学习
此示例显示了如何使用深度学习长期记忆(LSTM)网络对文本数据进行分类。
此示例显示了如何使用卷积神经网络对文本数据进行分类。
此示例显示了如何使用转换后的数据存储使用深度学习网络将失调的文本数据分类。
此示例显示了如何使用Recurrent序列到序列编码器模型转换为罗马数字。
此示例显示了如何对具有多个独立标签的文本数据进行分类。
使用深度学习生成文本(深度学习工具箱)
此示例显示了如何训练深度学习的长期记忆(LSTM)网络以生成文本。
此示例显示了如何训练深度学习LSTM网络以使用字符嵌入生成文本。
此示例显示了如何训练深度学习LSTM网络以生成单词的文字。
此示例显示了如何使用自定义培训循环的深度学习双向长期记忆(BILSTM)网络对文本数据进行分类。
此示例显示了如何使用自动编码器生成文本数据。
此示例显示了如何定义文本编码器模型函数。
此示例显示了如何定义文本解码器模型函数。
此示例显示了如何使用重复的序列到序列编码器模型来训练德语到英语翻译器。
语言支持万博1manbetx
有关使用文本分析工具箱功能的信息。
文本分析工具箱中有关日本支持的信息。万博1manbetx
此示例显示了如何使用主题模型导入,准备和分析日本文本数据。
文本分析工具箱中有关德语支持的信息。万博1manbetx
此示例显示了如何使用主题模型导入,准备和分析德语文本数据。