数据分析与人类语言数据

自然语言处理(NLP)是指广泛的一类计算技术的结合言语文本数据连同其他类型的工程数据,进入智能系统的发展。

原始人类语言数据可以来自各种来源,包括音频信号,网络和社交媒体,文件和包含有价值的信息数据库,如语音命令,在主题民情,操作数据和维护报告。自然语言处理可用于合并和简化数据的这些大来源,将它们变成有意义的洞察可视化主题模型机器学习分类。例如,使用MATLAB®你可以发现人类语言的存在下,在音频段,执行语音到文本转录,然后执行文本挖掘和机器学习这些来源。

自然语言处理是在金融使用,制造,电子,软件,信息技术等行业的应用,如:

  • 自动化基于情绪的评论进行分类,无论是正面或负面的
  • 计数的单词或短语的频率,文件和进行主题建模
  • 开发基于传感器和文本日志数据的预测设备的维修日程
  • 自动化标签和语音录音标注

要了解更多关于使用自然语言处理的语音和文本数据推导的了解,请参阅文本分析工具箱™音频工具箱™统计和机器学习工具箱™

也可以看看:数据科学机器学习深度学习情感分析文本挖掘长短期记忆(LSTM)网络