本人最近在做一个自动文档摘要相关的项目,研究了一下目前业界的一些评价方法,阅读了Chin-Yew Lin的《ROUGE: A Package for Automatic Evaluation of Summaries》的paper,也对应看了其他朋友整理的笔记,特整理此笔记供大家参考! 自动文档摘要评价方法大致分为两类: (1)内部评价方法(Intrinsic Methods)
文章目录 一、BLEU-N得分(Bilingual Evaluation Understudy)二、ROUGE-N得分(Recall-Oriented Understudy for Gisting Evaluation)1. 定义2. 计算N=1N=2 3. 程序 给定一个生成序列“The cat sat on the mat”和两个参考序列“The cat is on t