一瞬间的触动:PageRank

2023-12-11 01:32
文章标签 pagerank 触动 一瞬间

本文主要是介绍一瞬间的触动:PageRank,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

摘自《数学之美》

  1. 在互联网上,如果一个网页被很多其他网页所链接,说明它受到普遍的承认和信赖,那么它的排名就高。这就是PageRank的核心思想。当然Google的PageRank算法实际上要复杂得多。比如说,对来自不同网页的链接区别对待,因为那些排名高的网页的链接更可靠,于是要给这些链接以较大的权重。这就好比在现实世界中股东大会里的表决,要考虑每个股东的表决权( Voting Power),拥有20%表决权的股东和拥有1% 表决权的股东,对最后的表决结果的影响力明显不同。PageRank 算法考虑了这个因素,即网页排名高的网站贡献的链接权重大。
    现在举一个例子,我们知道一个网页Y的排名应该来自于所有指向这个网页的其他网页X,2….Xx的权重之和,如下图中,Y的网页排名pagerank= 0.001 + 0.01 + 0.02 + 0.05 = 0.081。

虽然佩奇和布林不强调这个算法中谁都贡献了什么思想,但是据我了解,上述想法应该来自于佩奇。接下来的问题是X,X2,Xz,X4的权重分别是多少,如何度量。佩奇认为,应该是这些网页本身的网页排名。现在麻烦来了,计算搜索结果的网页排名过程中需要用到网页本身的排名,这不成了“先有鸡还是先有蛋”的问题了吗?
破解这个怪圈的应该是布林。他把这个问题变成了一个二维矩阵相乘的问题,并用迭代的方法解决了这个问题。他们先假定所有网页的排名是相同的,并且根据这个初始值,算出各个网页的第一- 次迭代排名,然后再根据第一次迭代排名算出第二次的排名。他们两人从理论上证明了不论初始值如何选取,这种算法都能保证网页排名的估计值能收敛到排名的真实值。值得提的事, 这种算法不需要任何人工干预。

2.网页排名算法的高明之处在于它把整个互联网当作一个整体来对待。 这无意中符合了系统论的观点。相比之下,以前的信息检索大多把每一个网页当作独立的个体对待,大部分人当初只注意了网页内容和查询语句的相关性, 忽略了网页之间的关系。虽然在佩奇和布林同时代也有一此人在思考如何利用网页之间的联系来衡量网页的质量,但只是摸到一些皮毛,找到一些拼凑的办法,都没有从根本上解决问题。

这篇关于一瞬间的触动:PageRank的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/478992

相关文章

2024-8月,有没有那一瞬间让你悟到了过去10多年没有想明白的事

今年,我踏上了海外之旅,经历了长达4-5个月的阵痛期,期间充满了迷茫与挑战。无论是语言障碍还是环境适应,都让我感到前所未有的压力,甚至一度想要放弃,卷铺盖走人。然而,在每次的无奈与迷茫中,我都坚持了下来。如今,我已经基本适应了新的环境,是时候开始真正做些事情了。 最近,我研究了2012实验室和ICT基础设施的组织结构,看到了许多高级别总裁的身影。我不禁思考,是什么驱使他们能够在如此巨大的压力下持续

随机游走的PageRank算法 sensitive PageRank

随机游走的pagerank建立在pagerank基础之上, PageRank的简单介绍请看这里http://blog.csdn.net/zhonghuan1992/article/details/24396435 请先看随机游走的pageRank算法部分代码(代码写的挫了写见谅),根据代码分析 #include <cstdio>#include <cstring>#includ

PageRank算法浅析

转载请注明出处!!!http://blog.csdn.net/zhonghuan1992 本文是根据 Topic-Sensitive PageRank  Google’s PageRank:The Math Behind the Search Engine   http://blog.csdn.net/hguisu/article/details/7996185 http://blog

vue项目按键回车页面刷新且路由带?一瞬间消失

vue项目按键回车页面刷新且路由带?一瞬间消失 这是因为页面中带elementui表单,且表单中只有一个输入框,在该输入框中按下回车是提交表单 阻止这一默认行为,可以在el-form标签中添加@submit.native.prevent <el-form @submit.native.prevent></el-form>

从学校到这里~ 触动~~

来 兄弟连一个月了~~~ 说实话:现在还是没有融入这里~~始终没有把"我们"这个观念植入我的脑子里~~ 老是:"你们、你们"~~~来到这里的第一天~我就告诉自己:你是来 学习的~~ 这是你规划中的一部分~~ 既然选择就要努力走下去~~~我前前后后去过3个补习班~~ 最终没有成行的1个~~~但是兄弟连这里跟别的补习班真的不一样!! 这里和我来的学校真的不一样!!甚至我到学校不由自主的去向我身边的

soj2164Problem B:爱恨就在一瞬间

据说soj外网访问不了,那就贴题目吧 本来应该很简单的题,却让我花了很多时间。。。不过学到了更多 开始我的思路就不正确,想的是先枚举两点,再找与这两点共线的点累加,这样以来复杂度就是10e9,根本跑不了,于是比赛时我就没做出来。。。。 吴大大教给我们的思路是,从1到n,枚举这个点与之后的所有点的斜率,再统计数量最多的哪个斜率。这样做的正确性在于,如果在某个枚举点可以取到最大值,且

Android之打开APP部分页面(Activity)的一瞬间手机状态栏会变成蓝色解决办法

一、问题 我们在打开app部分页面的时候状态栏是蓝色的,一闪而过。    二、原因和解决办法 我们在AndroidManifest.xml给application配置主题,然后主题是这一样的 <style name="*****" parent="*****"><!-- Customize your theme here. --><item name="color

搜索引擎算法之初探——PageRank、DocRank

从文档集合中找出出现搜索词的文档,进一步可能是通过搜索词在文档中出现的次数来对文档排名,这种搜索就是信息检索(Information retrieval)。 有很多现有的库可以很方便的就让我们做出来这些工作,其中最有名的当属Lucene了。当然,现在的搜索已不单单是索引了,而在于链接分析、用户点击分析和自然语言处理等方面,这些技术能大大的增强搜索的性能。 基本搜索 构建一个搜索引擎的基本步骤

【补充】图神经网络前传——PageRank

对于任何一个网页,都可以给出网页的重要度,给每个网页重要度打分,高分的靠前。 改变世界的谷歌PageRank算法_哔哩哔哩_bilibili (这个参考资料考虑之后去自己看看) 把互联网用图来表示,每一个网页就是一个节点,网页之间的引用(放一个超链接,比如)就是边。不过现在可能这样就不太方便了,因为现在的网页是可以随时生成的(比如支付成功页面),同时还有无法触达的部分(比如朋