基于MATLAB的文本挖掘

从文本数据中获得洞察力

文本挖掘是指使用数据分析技术搜索文本数据中的模式,包括导入、探索、可视化,并将统计和机器学习算法应用于文本数据。

人工阅读和分类大量的文本对人类来说是不可逾越的;MATLAB®可以有效和高效地自动化该过程,让您与数据交互并可视化,以确定模式、趋势和其他方式无法找到的复杂关系。

文本挖掘用于派生定量统计在大型非结构化文本集上,主题在文档中使用主题建模,定性推论情绪分析,以及其他有价值的信息。文本挖掘应用于金融、制造业、信息技术和许多其他行业。应用程序包括:

  • 计算文档中单词或短语的频率并执行数据分析
  • 根据情绪自动分类评论,无论是积极的还是消极的
  • 根据传感器和文本日志数据制定预测性设备维护计划

要了解更多关于使用文本挖掘从文本数据中获得洞察力的信息,请参见文本分析工具箱™统计和机器学习工具箱™

参见:数据科学机器学习统计和机器学习工具箱自然语言处理情绪分析长短期记忆(LSTM)网络语法