建模与预测
使用主题模型和词嵌入开发预测模型
要从高维文本数据集中寻找集群和提取特征,可以使用机器学习技术和模型,如LSA、LDA和词嵌入。您可以将使用文本分析工具箱™创建的功能与来自其他数据源的功能结合起来。通过这些特性,您可以构建利用文本、数字和其他类型数据的机器学习模型。
功能
主题
分类与建模
- 创建简单的预处理函数
这个例子展示了如何创建一个函数来清理和预处理文本数据以供分析。 - 创建简单的文本分类模型
这个例子展示了如何使用单词袋模型训练一个简单的文本分类器的词频计数。 - 使用文档嵌入对文档进行分类
这个例子展示了如何通过使用词嵌入将文档转换为特征向量来训练文档分类器。 - 使用多词短语分析文本数据
这个例子展示了如何使用n-gram频率计数分析文本。 - 使用主题模型分析文本数据
这个例子展示了如何使用潜狄利克雷分配(LDA)主题模型来分析文本数据。 - 为LDA模型选择主题数量
这个例子展示了如何为潜在狄利克雷分配(LDA)模型决定适当数量的主题。 - 比较LDA求解器
这个例子展示了如何通过比较拟合优度和拟合模型所花费的时间来比较潜在狄利克雷分配(LDA)求解器。 - 使用LDA模型可视化文档集群
这个示例展示了如何使用潜狄利克雷分配(Latent Dirichlet Allocation, LDA)主题模型和t-SNE图来可视化文档的聚类。 - 可视化LDA主题相关性
这个例子展示了如何在潜狄利克雷分配(LDA)主题模型中分析主题之间的相关性。 - 可视化LDA主题和文档标签之间的相关性
这个例子展示了如何拟合潜狄利克雷分配(Latent Dirichlet Allocation, LDA)主题模型,并可视化LDA主题与文档标签之间的相关性。 - 创建共现网络
这个例子展示了如何使用单词袋模型创建共现网络。
情感分析与关键词提取
- 分析文本中的情感
这个例子展示了如何使用价感字典和情感推理器(VADER)算法进行情感分析。 - 生成领域特定的情感词汇
这个例子展示了如何使用10-K和10-Q财务报告生成用于情绪分析的词汇。 - 训练一个情感分类器
这个例子展示了如何使用带注释的积极和消极情绪词汇列表以及预训练的词汇嵌入来训练一个用于情感分析的分类器。 - 使用RAKE从文本数据中提取关键字
这个例子展示了如何使用快速自动关键字提取(RAKE)从文本数据中提取关键字。 - 使用TextRank从文本数据中提取关键字
这个例子展示了如何使用TextRank从文本数据中提取关键字。
深度学习
- 使用深度学习分类文本数据
这个例子展示了如何使用深度学习长短期记忆(LSTM)网络对文本数据进行分类。 - 基于卷积神经网络的文本数据分类
这个例子展示了如何使用卷积神经网络对文本数据进行分类。 - 使用深度学习分类内存不足的文本数据
这个示例展示了如何使用转换后的数据存储对深度学习网络中的内存不足文本数据进行分类。 - 使用注意力的序列到序列转换
这个例子展示了如何使用循环序列到序列的编码器-解码器模型将十进制字符串转换为罗马数字。 - 基于深度学习的多标签文本分类
这个例子展示了如何对具有多个独立标签的文本数据进行分类。 - 使用深度学习生成文本(深度学习工具箱)
这个例子展示了如何训练深度学习长短期记忆(LSTM)网络来生成文本。 - 傲慢与偏见和MATLAB
这个例子展示了如何训练一个深度学习LSTM网络来使用字符嵌入生成文本。 - 使用深度学习逐字生成文本
这个例子展示了如何训练一个深度学习LSTM网络来逐字生成文本。 - 使用自定义训练循环分类文本数据
这个例子展示了如何使用带有自定义训练循环的深度学习双向长短期记忆(BiLSTM)网络对文本数据进行分类。 - 使用自动编码器生成文本
这个例子展示了如何使用自动编码器生成文本数据。 - 定义文本编码器模型函数
这个例子展示了如何定义一个文本编码器模型函数。 - 定义文本解码器模型函数
这个例子展示了如何定义一个文本解码器模型函数。 - 使用深度学习的语言翻译
这个例子展示了如何使用循环序列到序列编码器-解码器模型训练一个德语到英语的翻译。
语言支持万博1manbetx
- 语言的注意事项
有关为其他语言使用“文本分析工具箱”功能的信息。 - 日语支持万博1manbetx
在文本分析工具箱中提供日语支持的信息。万博1manbetx - 分析日语文本数据
这个例子展示了如何使用主题模型导入、准备和分析日语文本数据。 - 德语语言支持万博1manbetx
在文本分析工具箱中有关德语支持的信息。万博1manbetx - 分析德语文本数据
本示例展示如何使用主题模型导入、准备和分析德语文本数据。