使用TextRank提取关键字
你可以尝试不同的关键字提取算法,看看什么最适合你的数据。由于TextRank关键字算法采用基于词性标签的方法提取候选关键字,因此提取的关键字可以很短。或者,您可以尝试使用RAKE算法提取关键字,该算法提取分隔符之间出现的标记序列作为候选关键字。要使用RAKE提取关键字,请使用rakeKeywords
函数。想要了解更多,请看利用RAKE从文本数据中提取关键字.
Mihalcea, Rada和Paul Tarau。“Textrank:将秩序带入文本。”在2004年自然语言处理经验方法会议论文集, 404 - 411页。2004.