本文主要是介绍从PageRank到TextRank的简要介绍,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
PageRank
PageRank部分主要参考bilibili网站的视频,视频讲解的比较清晰易懂,视频目录内容如下:
接下来做简单的几点总结:
- PageRank的定义和由来
PageRank,网页排名,又称网页级别、Google左侧排名或佩奇排名,是一种由 [1] 根据网页之间相互的超链接计算的技术,而作为网页排名的要素之一,以Google公司创办人拉里·佩奇(Larry Page)之姓来命名。Google用它来体现网页的相关性和重要性,在搜索引擎优化操作中是经常被用来评估网页优化的成效因素之一。Google的创始人拉里·佩奇和谢尔盖·布林于1998年在斯坦福大学发明了这项技术。 - 基本公式及计算过程
见下图:
- DeadEnds和SpiderTrips问题
注:由于我考虑将其用在点云中,点云一定能找到相邻的点,所以这两个问题都不存在。 - 代码部分
TextRank
主要参考论文:[张祖平, 沈晓阳. 基于深度学习的用户行为推荐方法研究[J]. 计算机工程与应用, 2019, 55(04):147-152+163.]
- 论文主要内容:由于文本和网页有类似的相互链接的特点,所以作者将PageRank算法运用在文本中,也叫作TextRank。将word2vector和TextRank方法相结合,考虑词与词之间的内部联系。
在这篇论文中,以及很多其他地方提到的PageRank的公式可能和上述公式不一致,如下:
注:上述公式中提到的阻尼系数是考虑用户感到无聊,停止点击,随机输入一个新URL而不是通过网页链接的概率
这篇关于从PageRank到TextRank的简要介绍的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!