要从高维文本数据集中找到聚类并提取特征,可以使用机器学习技术和模型,如LSA、LDA和单词嵌入。您可以将文本分析工具箱™创建的特性与来自其他数据源的特性结合起来。通过这些特性,您可以构建利用文本、数字和其他类型数据的机器学习模型。
此示例显示如何创建清除和预处理文本数据进行分析的函数。
这个例子展示了如何使用单词袋模型训练一个简单的文本分类器的单词频率计数。
此示例显示如何使用n克频率计数分析文本。
此示例显示如何使用潜在Dirichlet分配(LDA)主题模型分析文本数据。
这个示例展示了如何为潜在Dirichlet分配(LDA)模型确定合适的主题数量。
此示例显示如何通过比较适合的良好和适合模型所需的时间来比较潜在的Dirichlet分配(LDA)求解器。
这个例子展示了如何使用Latent Dirichlet Allocation (LDA)主题模型和t-SNE图来可视化文档的集群。
此示例显示了如何分析潜在Dirichlet分配(LDA)主题模型中主题之间的相关性。
这个示例展示了如何适应Latent Dirichlet Allocation (LDA)主题模型,并可视化LDA主题和文档标签之间的关联。
此示例显示如何使用袋式模型创建共生网络。
这个例子展示了如何使用价感知字典和情感推理(VADER)算法进行情感分析。
此示例显示如何使用10-K和10-Q财务报告生成用于情感分析的词汇。
这个例子展示了如何使用带注释的正面和负面情感词列表和预先训练的词嵌入来训练情感分析分类器。
这个例子展示了如何使用快速自动关键字提取(RAKE)从文本数据中提取关键字。
这个例子展示了如何使用TextRank从文本数据中提取关键字。
这个例子展示了如何使用深度学习长短期记忆(LSTM)网络对文本数据进行分类。
这个例子展示了如何使用卷积神经网络对文本数据进行分类。
这个例子展示了如何用深度学习网络使用转换后的数据存储对内存不足的文本数据进行分类。
这个示例演示了如何使用循环序列到序列编码器-解码器模型将十进制字符串转换为罗马数字。
这个示例展示了如何对具有多个独立标签的文本数据进行分类。
使用深度学习生成文本(深度学习工具箱)
此示例显示如何培训深度学习长期内存(LSTM)网络以生成文本。
这个例子展示了如何训练深度学习LSTM网络来使用字符嵌入生成文本。
此示例显示如何培训深度学习LSTM网络以生成文本逐个字。
这个例子展示了如何使用带有自定义训练循环的深度学习双向长短期记忆(BiLSTM)网络对文本数据进行分类。
此示例显示如何使用autoencoders生成文本数据。
这个例子展示了如何定义一个文本编码器模型函数。
这个例子展示了如何定义一个文本解码器模型函数。
此示例显示如何使用重复序列到序列编码器 - 解码器模型培训德语到英语语言转换器。
有关为其他语言使用文本分析工具箱功能的信息。
文本分析工具箱中日语支持的信息。万博1manbetx
这个示例展示了如何使用主题模型导入、准备和分析日语文本数据。
关于文本分析工具箱中的德语支持的信息。万博1manbetx
这个示例展示了如何使用主题模型导入、准备和分析德语文本数据。