mmr专题

摘要抽取算法——最大边界相关算法MMR(Maximal Marginal Relevance) 实践

NLP(自然语言处理)领域一个特别重要的任务叫做——文本摘要自动生成。此任务的主要目的是快速的抽取出一篇文章的主要内容,这样读者就能够通过最少的文字,了解到文章最要想表达的内容。由于抽取出来的摘要表达出了文章最主要的含义,所以在做长文本分类任务时,我们可以采用文本摘要算法将长文本的摘要抽取出来,在采用短文本分类模型去做文本分类,有时会起到出奇的好效果。 文本摘要自动生成算法 文本摘要抽取算法主

MMR算法学习

MMR MMR的全称为Maximal Marginal Relevance ,中文名字为最大边界相关法或者最大边缘相关。 在MMR的公式是这样的,截图来自http://www.cnblogs.com/little-horse/p/7191287.html 由于我们算的是自动摘要,所以主要看下面的公式。 左边的score计算的是句子的重要性分值,右边的计算的是句子与所有已经被选择成为摘要