帮助中心帮助中心
文档评分与TextRank算法
自从R2020a
分数= textrankScores(文档)
分数= textrankScores(包)
例子
分数= textrankScores (文档)分数文档根据使用TextRank算法的成对相似度值为重要性。为了计算相似性和重要性分数,该函数分别使用BM25和PageRank算法。
分数= textrankScores (文档)
分数
文档
分数= textrankScores (袋)对用单词袋或n-grams袋模型编码的文档进行评分袋.
分数= textrankScores (袋)
袋
全部折叠
创建一个标记化文档数组。
STR = [敏捷的棕色狐狸跳过了懒惰的狗。“敏捷的棕色狐狸跳过了懒惰的狗。”懒狗坐在那里什么也不做“其他动物坐在那里看着”];documents = tokenizedDocument(str)
9个token:敏捷的棕色狐狸跳过了懒惰的狗9个token:敏捷的棕色狐狸跳过了懒惰的狗8个token:懒惰的狗坐在那里什么也没做6个token:其他动物坐在那里看着
计算TextRank分数。
分数= textrankScores(文档);
在柱状图中可视化分数。
图表栏(scores)“文档”) ylabel (“分数”)标题(“TextRank分数”)
中的文本数据创建单词袋模型sonnets.csv.
sonnets.csv
文件名=“sonnets.csv”;TBL =可读(文件名,“TextType”,“字符串”);textData = tbl.十四行诗;documents = tokenizedDocument(textData);bag = bagOfWords(文档)
词汇:["来自" "最美丽的" "生物" "我们" "渴望" "增加" "那" "因此" "美" "玫瑰" "可能" "永远" "死亡" "但是" "作为" " "成熟" "应该" "由" "时间"…NumWords: 3527 NumDocuments: 154
分数= textrankScores(包);
tokenizedDocument
输入文档,指定为tokenizedDocument数组、单词的字符串数组或字符向量的单元格数组。如果文档不是tokenizedDocument数组,则它必须是表示单个文档的行向量,其中每个元素都是一个单词。若要指定多个文档,请使用tokenizedDocument数组中。
bagOfWords
bagOfNgrams
输入单词袋或n-grams袋模型,指定为bagOfWords对象或bagOfNgrams对象。如果袋是一个bagOfNgrams对象,则该函数将每个n-gram视为单个单词。
TextRank分数,返回为N-by-1向量,其中分数(我)对应的分数我Th输入文档和N是输入文档的数量。
分数(我)
我
Mihalcea, Rada和Paul Tarau。“Textrank:为文本带来秩序。”在2004年自然语言处理经验方法会议论文集,第404-411页。2004.
R2020a中引入
tokenizedDocument|bleuEvaluationScore|rougeEvaluationScore|bm25Similarity|cosineSimilarity|lexrankScores|mmrScores|extractSummary
bleuEvaluationScore
rougeEvaluationScore
bm25Similarity
cosineSimilarity
lexrankScores
mmrScores
extractSummary
我不知道你在说什么。想要一个美好的梦?
海脂循环匹配函数对应求解MATLAB:
Esegui il commanmando inserendolo nella finestra di commanmando MATLAB。我的浏览器web不支持和MATLAB万博1manbetx。
选择一个网站,在可用的地方获得翻译的内容,并查看当地的活动和优惠。根据您所在的位置,我们建议您选择:.
您也可以从以下列表中选择一个网站:
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。
联系当地办事处