自然语言处理

使用人类语言数据进行数据分析

自然语言处理(NLP)是用于合并的一类广泛的计算技术演讲文本数据,以及其他类型的工程数据,用于智能系统的开发。

原始人类语言数据可以来自多种来源,包括音频信号、网络和社交媒体、包含有价值信息(如语音命令、公众话题情绪、操作数据和维护报告)的文档和数据库。自然语言处理可以用来组合和简化这些大型数据源,将它们转换为有意义的洞察力可视化主题模型,机器学习分类器.例如,使用MATLAB®你可以在一个音频片段中检测人类语言的存在,执行语音识别然后对这些资源进行文本挖掘和机器学习。

自然语言处理用于金融、制造、电子、软件、信息技术和其他行业的应用,如:

  • 根据情绪自动分类评论,无论是积极的还是消极的
  • 计算文档中单词或短语的频率并进行主题建模
  • 根据传感器和文本日志数据制定预测性设备维护计划
  • 自动标记和标签的语音录音

要了解更多关于使用自然语言处理从语音和文本数据中获得理解的信息,请参见文本分析工具箱™音频工具箱™,统计和机器学习工具箱™

参见:数据科学机器学习深度学习情绪分析文本挖掘长短期记忆(LSTM)网络语法