从文本数据中获得洞察力

文本挖掘是指使用数据分析技术在文本数据中搜索模式,包括导入、探索、可视化以及对文本数据应用统计和机器学习算法。

手工阅读和分类大量文本对人类来说是无法克服的;MATLAB®可以有效且高效地自动化流程,让您与数据交互并可视化数据,以识别模式、趋势和复杂的关系。

文本挖掘用于派生定量统计在大型非结构化文本集上,主题在文档中使用主题建模,定性推论情绪分析,以及其他有价值的信息。文本挖掘被用于金融、制造、信息技术和许多其他行业。应用程序包括:

  • 计算文档中单词或短语的频率并执行数据分析
  • 自动分类评论基于情绪,无论是积极的或消极的
  • 开发基于传感器和文本日志数据的预测设备维护计划

要了解有关使用文本挖掘从文本数据中获得洞察力的更多信息,请参见文本分析工具箱™统计和机器学习工具箱™

参见:数据科学,机器学习,统计和机器学习工具箱,自然语言处理,情绪分析,长短时记忆(LSTM)网络