Text Analytics Toolbox™为文本数据的预处理、分析和建模提供了算法和可视化。使用工具箱创建的模型可用于情感分析、预测维护和主题建模等应用程序。
文本分析工具箱包括用于处理来自设备日志、新闻源、调查、运营商报告和社交媒体等来源的原始文本的工具。您可以从流行的文件格式中提取文本,预处理原始文本,提取单个单词,将文本转换为数字表示,并构建统计模型。
使用机器学习技术,如LSA、LDA和单词嵌入,您可以从高维文本数据集找到聚类并创建特征。使用Text Analytics Toolbox创建的功能可以与来自其他数据源的功能相结合,以构建利用文本、数字和其他类型数据的机器学习模型。
这个例子展示了如何使用文本分析分类文本数据只使用10行MATLAB®代码。
从不同的来源导入文本数据。
这个例子展示了如何创建一个函数来清理和预处理文本数据以进行分析。
这个示例展示了如何使主题模型适合文本数据并可视化主题。
这个例子展示了如何使用单词云可视化文本数据。
文本分析术语表。