狐猴

将单词减少到其字典形式

柠檬酸是一种文本归一化技术自然语言处理。lematization使用词汇和形态分析来消除单词词缀。例如,“建筑物的地板”减少为“建筑物”,在柠檬酸时“建造”。

柠檬水应用程序

狐猴通常用于:

  • 扩展搜索标准的信息检索
  • 降低文本分类,情感分析或主题建模中问题的维度

柠檬酸与茎

一种相关的诱饵方法,,基于简单的启发式规则。它通常会导致根部或单词部分不是实际单词,而lemmatization总是返回有效的字典单词。

柠檬酸和茎的例子如下所示。

实际单词 狐猴
要求 要求 需要
应用 申请 应用

在Matlab®,可以使用“引理”的样式选项使用“归一化词”功能来完成Lemmatization。要了解有关使用MATLAB的文本数据使用lemmatization和构建预测模型的更多信息,请参见文本分析工具箱™

也可以看看:自然语言处理,,,,情感分析,,,,Word2Vec,,,,,,,,n-gram,,,,使用MATLAB的文字开采,,,,数据科学,,,,深度学习,,,,深度学习工具箱™,,,,统计和机器学习工具箱™