帮助中心帮助中心
使用TextRank算法进行文档评分
scores = textrankScores(文档)
scores = textrankScores(书包)
例子
分数= textrankScores (文档)分数文档根据使用TextRank算法的两两相似性值来确定重要性。为了计算相似性和重要性分数,该函数分别使用BM25和PageRank算法。
分数= textrankScores (文档)
分数
文档
分数= textrankScores (袋)对由词袋模型或n-grams模型编码的文档进行评分袋.
分数= textrankScores (袋)
袋
全部折叠
创建一个标记化文档数组。
STR = ["敏捷的棕色狐狸跳过了懒惰的狗"快速的棕色狐狸跳过了懒惰的狗。懒惰的狗坐在那里什么也没做。“其他动物坐在那里看着。”];documents = tokenizedDocument(str)
文档= 4×1 tokenized文档:9个令牌:快速的棕色狐狸跳过了懒惰的狗9个令牌:快速的棕色狐狸跳过了懒惰的狗8个令牌:懒惰的狗坐在那里什么也不做6个令牌:其他动物坐在那里观看
计算TextRank分数。
scores = textrankScores(文档);
在条形图中可视化分数。
图条(分数)xlabel(“文档”) ylabel (“分数”)标题(“TextRank分数”)
从中的文本数据创建词袋模型sonnets.csv.
sonnets.csv
文件名=“sonnets.csv”;TBL = readtable(文件名,“TextType”,“字符串”);textData = tbl.Sonnet;documents = tokenizedDocument(textData);bag = bagOfWords(文件)
bag = bagOfWords with properties: Counts: [154×3527 double] Vocabulary: [1×3527 string] NumWords: 3527 NumDocuments: 154
scores = textrankScores(bag);
tokenizedDocument
输入文档,指定为tokenizedDocument数组,单词的字符串数组,或字符向量的单元格数组。如果文档不是。tokenizedDocument数组,那么它必须是表示单个文档的行向量,其中每个元素都是一个单词。要指定多个文档,请使用tokenizedDocument数组中。
bagOfWords
bagOfNgrams
输入bag-of-words或bag-of-n-grams模型,指定为abagOfWords对象或bagOfNgrams对象。如果袋是一个bagOfNgrams对象,则该函数将每个n-gram视为单个单词。
TextRank分数,作为N- × 1向量,其中分数(我)对应的分数我输入文档和N是输入文档的数量。
分数(我)
我
[1]米哈尔恰、拉达和保罗·塔劳。“文本秩:给文本带来秩序。”在2004年自然语言处理经验方法会议论文集,第404-411页。2004.
tokenizedDocument|bleuEvaluationScore|rougeEvaluationScore|bm25Similarity|cosineSimilarity|lexrankScores|mmrScores|extractSummary
bleuEvaluationScore
rougeEvaluationScore
bm25Similarity
cosineSimilarity
lexrankScores
mmrScores
extractSummary
?
。
。WebブラウザーはMATLABコマンドをサポートしていません。
选择一个网站获取翻译后的内容,并查看当地的活动和优惠。根据您的位置,我们建议您选择:.
你亦可选择下列网址:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家网站没有针对您所在位置的访问进行优化。
与当地办事处联系