主要内容

ratioSentimentScores

使用比率规则进行情感评分

描述

使用ratioSentimentScores用比例规则评价符号化文本中的情感。的ratioSentimentScores函数默认使用VADER情感词典。

例子

compoundScores= ratioSentimentScores (文档根据正标记和负标记的比率,返回标记化文档的情绪得分。对于每个文档,正数与负数的比率大于1,函数返回1。对于负分与正分之比大于1的每个文档,该函数返回-1。否则,函数返回0。

compoundScorespositiveScoresnegativeScores) = ratioSentimentScores (文档还返回文档的正负标记分数的和。

例子

___= ratioSentimentScores (___名称,值使用一个或多个名称-值对指定附加选项。

例子

全部折叠

创建标记化文档。

str = [“这本书很好!!!!”“这本书糟透了。”];文件= tokenizedDocument (str);

评估标记化文档的情感。1分表示积极情绪,-1分表示消极情绪,0分表示中性情绪。

compoundScores = ratioSentimentScores(文档)
compoundScores =2×11

情感分析算法依赖于被称为情感词典的带注释的单词列表。例如,ratioSentimentScores函数使用了一个情绪词典,其中的单词标注了从-1到1的情绪评分,分数接近1表示强烈的积极情绪,分数接近-1表示强烈的消极情绪,分数接近零表示中性情绪。

如果情感词典被使用ratioSentimentScores函数不适合您正在分析的数据,例如,如果您有一个特定于领域的数据集(如医学或工程数据),那么您可以使用自己的自定义情感词典。有关如何生成特定于领域的情感词典的示例,请参见生成领域特定情感词典

创建一个包含要分析的文本数据的标记化文档数组。

textData = [“这家公司的增长势头非常强劲。”“这家公司被指控误导消费者。”];文件= tokenizedDocument (textData);

为金融数据加载示例特定于领域的词汇。

文件名=“financeSentimentLexicon.csv”;台= readtable(文件名);头(台)
ans =8×2表Token SentimentScore _________________ ______________ {'opportunities'} 0.95633 {'innovative'} 0.89635 {'success'} 0.84362 {'focused'} 0.83768 {'strong'} 0.81042 {'capabilities'} 0.79174 {'innovation'} 0.77698 {'improved'} 0.77176

用……来评估你的情绪ratioSentimentScores函数,并指定自定义情感词典“SentimentLexicon”选择。1分表示积极情绪,-1分表示消极情绪,0分表示中性情绪。

compoundScores = ratioSentimentScores(文档,“SentimentLexicon”(资源)
compoundScores =2×11

输入参数

全部折叠

输入文档,指定为tokenizedDocument数组中。

名称-值参数

指定可选的用逗号分隔的对名称,值参数。的名字参数是name和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:0.5阈值,将比率阈值设置为0.5

情感词典,指定为一个表,包含以下列:

  • 令牌-令牌,指定为字符串标量。

  • SentimentScore—token的情绪评分,指定为数字标量。

默认的情绪词典是VADER情绪词典。

数据类型:表格

比率阈值,指定为一个非负标量。

如果正分数与负分数之比文档(我)大于阈值,然后compoundScores(我)是1。如果负数分数与正数分数之比文档(我)大于阈值,然后compoundScores(我)是1。否则,compoundScores(我)是0。

数据类型:||int8|int16|int32|int64|uint8|uint16|uint32|uint64

输出参数

全部折叠

复合情绪得分,作为数字向量返回。该函数为每个输入文档返回一个分数。

如果正分数与负分数之比文档(我)大于阈值,然后compoundScores(我)是1。如果负数分数与正数分数之比文档(我)大于阈值,然后compoundScores(我)是1。否则,compoundScores(我)是0。

积极情绪得分,以数字向量返回。该函数为每个输入文档返回一个分数。的值positiveScores(我)对应的正面情绪得分文档(我)

负情绪得分,作为数字向量返回。该函数为每个输入文档返回一个分数。的值negativeScores(我)对应的是消极情绪得分文档(我)

介绍了R2019b