开始文本分析工具箱
分析和建模文本数据
文本分析工具箱™提供了用于预处理、分析和建模文本数据的算法和可视化。使用工具箱创建的模型可用于情感分析、预测性维护和主题建模等应用程序。
文本分析工具箱包括用于处理来自设备日志、新闻提要、调查、操作员报告和社交媒体等来源的原始文本的工具。您可以从流行的文件格式提取文本、预处理原始文本、提取单个单词、将文本转换为数字表示以及构建统计模型。
使用诸如LSA、LDA和词嵌入等机器学习技术,您可以从高维文本数据集中找到集群并创建特征。使用“文本分析工具箱”创建的功能可以与来自其他数据源的功能相结合,以构建利用文本、数字和其他类型数据的机器学习模型。
教程
- 在10行代码中尝试文本分析
本示例展示了如何使用文本分析仅使用10行MATLAB®代码对文本数据进行分类。
- 将文本数据导入MATLAB
从不同来源导入文本数据。
- 创建简单的预处理函数
这个例子展示了如何创建一个函数来清理和预处理文本数据以供分析。
- 开始主题建模
这个示例展示了如何使主题模型适合文本数据并可视化主题。
- 使用单词云可视化文本数据
这个例子展示了如何使用单词云可视化文本数据。
了解更多
- 文本分析术语
文本分析术语术语表。