本文主要是介绍在谷歌搜索,打上自己想要的信息后,到出来搜索结果的流程---------------自己猜的!!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
一直琢磨,譬如:谷歌通过一个外链<a href="">seo</a>进入这个网站,然后抓取网站里面的内容,在这个抓取过程中的流程,和抓取后的结果,谷歌是怎么处理的,怎么分析这个网站,我得到那些数据,谷歌怎么从这些数据信息中析构出那些关键词,这些关键词怎么评的分,评分后怎么处理,在数据库中是怎么一个结构,琢磨的遇到了瓶颈,怎么也过不去,细想了一下,从搜索方面考虑,姑姑大哥的终极理念不就是给搜索用户得到用户想要的信息吗?怎么判断,可以通过自己写一些搜索的内容,看搜索结果的数据,分析这些数据,毕竟可控,可以看到,可以看到一些自己可以分析的数据,这样的话,也是一种逆向的不错的方法,自己就瞎琢磨了这些流程,用来解释我搜索的想象。
1
我搜索的现象:
1.1
不正常的内容太多,谷歌会拒绝查询,譬如:d:/fdf/fdfw/g/h/gh/g//v/cxg/fd/gf/h/fd/g,在谷歌查询,谷歌拒绝查询
1.2
在打入单词,只要每一个单词都是英文正规单词,譬如:
nate strategic Majority Leader good Increased the Sales Majority Leader good Increased prioritize made that Dick Durbin Niche Retail a Reports Neglect Majority Leader good Increased Crucial Majority Leader good Increased Survival Tool move its Majority Leader good Increased loyalty to Partner has
无论这个问题多么的杂乱五章,语句多么的不通顺,字母多么的多,总之,只要每一个单词是合法的,就会出结果来
3
有一些搜索中没有我写的关键字,譬如:我搜索magento wiki how to get a featrured product,出来一个网站没有wiki这个单词,但是排在了第4名,这个站是一个在magento方面很有权威性的站点,关键词匹配不全面,照样出来,
看来谷歌在研究这个需要什么样的信息方面,的确,牛逼,不和百度似的,技术达不到这个要求,有时候我就想了,百度的搜索结果不全面,所以推出了一个百度百科,百度知道,然后累计大家经常遇到的问题,然后让大家上谷歌找资料,解答这个问题。百度做的是中国的搜索引擎,所以可行性蛮高的,慢慢的,百度不是一个搜索引擎,而是一个查询库,靠中国人上谷歌搜索资料,进行累积的库,技术不行,也有牛逼的理由,因为,我的方式牛逼!!
自己猜的流程:
内容查询--->分析内容里面的信息是否合法,如果不合法,查看不合法的比例,然后不合法的信息进行查询,是否有结果,如果没有,则定位不合法信息,如果不合法信息过高,则拒绝继续查询
--->信息满足谷歌的合法分析后,然后对每个单词进行匹配,按照一个匹配比例值,譬如:90%,单词匹配。这样将,带有搜索内容的网站都给查询出来了,然后根据“单体”匹配度评分。
--->在按照语法方面的匹配度,进行评分,譬如:magento how to get a featured product,如果how to get a featured product,直接在某个网页直接匹配,这样获得的分值会高!
--->该页面的权重评分,权重高的网页相当于专家,分值高
--->在搜索内容中的关键词划分,然后查看划分后的关键词在该网页中的地位,譬如是在内容中,还是在title,keyword,description中,等然后在给一个分值,也有可能该步骤没有,直接权重搞定,猜把。
--->在没有完整匹配的情况下,就要把这个内容拆分成几个关键字,这里应该看该关键字对应的网站的一个综合得分把,包括该关键字的外链情况,也就是这个关键字对应的这个URL网页,谷歌给定的分值,然后换算成该算法中的分值,然后在打分。
--->也许有条件符合评分,譬如权重高的站,匹配度高,带来的复合条件评分,等,这些应该都是有可能的吧!
然后根据这个分值,然后排列出来
猜的,没权威性!!
这篇关于在谷歌搜索,打上自己想要的信息后,到出来搜索结果的流程---------------自己猜的!!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!