在谷歌搜索,打上自己想要的信息后,到出来搜索结果的流程---------------自己猜的!!

2024-03-25 14:18

本文主要是介绍在谷歌搜索,打上自己想要的信息后,到出来搜索结果的流程---------------自己猜的!!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一直琢磨,譬如:谷歌通过一个外链<a href="">seo</a>进入这个网站,然后抓取网站里面的内容,在这个抓取过程中的流程,和抓取后的结果,谷歌是怎么处理的,怎么分析这个网站,我得到那些数据,谷歌怎么从这些数据信息中析构出那些关键词,这些关键词怎么评的分,评分后怎么处理,在数据库中是怎么一个结构,琢磨的遇到了瓶颈,怎么也过不去,细想了一下,从搜索方面考虑,姑姑大哥的终极理念不就是给搜索用户得到用户想要的信息吗?怎么判断,可以通过自己写一些搜索的内容,看搜索结果的数据,分析这些数据,毕竟可控,可以看到,可以看到一些自己可以分析的数据,这样的话,也是一种逆向的不错的方法,自己就瞎琢磨了这些流程,用来解释我搜索的想象。

1

我搜索的现象:

1.1

不正常的内容太多,谷歌会拒绝查询,譬如:d:/fdf/fdfw/g/h/gh/g//v/cxg/fd/gf/h/fd/g,在谷歌查询,谷歌拒绝查询

1.2

在打入单词,只要每一个单词都是英文正规单词,譬如:

nate strategic Majority Leader  good Increased  the Sales Majority Leader  good Increased  prioritize made that Dick Durbin Niche Retail a Reports   Neglect Majority Leader  good Increased   Crucial Majority Leader  good Increased  Survival Tool move its Majority Leader  good Increased  loyalty to Partner has

无论这个问题多么的杂乱五章,语句多么的不通顺,字母多么的多,总之,只要每一个单词是合法的,就会出结果来

3

有一些搜索中没有我写的关键字,譬如:我搜索magento  wiki   how to  get a featrured  product,出来一个网站没有wiki这个单词,但是排在了第4名,这个站是一个在magento方面很有权威性的站点,关键词匹配不全面,照样出来,

 

看来谷歌在研究这个需要什么样的信息方面,的确,牛逼,不和百度似的,技术达不到这个要求,有时候我就想了,百度的搜索结果不全面,所以推出了一个百度百科,百度知道,然后累计大家经常遇到的问题,然后让大家上谷歌找资料,解答这个问题。百度做的是中国的搜索引擎,所以可行性蛮高的,慢慢的,百度不是一个搜索引擎,而是一个查询库,靠中国人上谷歌搜索资料,进行累积的库,技术不行,也有牛逼的理由,因为,我的方式牛逼!!

 

自己猜的流程:

 

内容查询--->分析内容里面的信息是否合法,如果不合法,查看不合法的比例,然后不合法的信息进行查询,是否有结果,如果没有,则定位不合法信息,如果不合法信息过高,则拒绝继续查询

--->信息满足谷歌的合法分析后,然后对每个单词进行匹配,按照一个匹配比例值,譬如:90%,单词匹配。这样将,带有搜索内容的网站都给查询出来了,然后根据“单体”匹配度评分。

--->在按照语法方面的匹配度,进行评分,譬如:magento  how to get a featured product,如果how to get a featured product,直接在某个网页直接匹配,这样获得的分值会高!

--->该页面的权重评分,权重高的网页相当于专家,分值高

--->在搜索内容中的关键词划分,然后查看划分后的关键词在该网页中的地位,譬如是在内容中,还是在title,keyword,description中,等然后在给一个分值,也有可能该步骤没有,直接权重搞定,猜把。

--->在没有完整匹配的情况下,就要把这个内容拆分成几个关键字,这里应该看该关键字对应的网站的一个综合得分把,包括该关键字的外链情况,也就是这个关键字对应的这个URL网页,谷歌给定的分值,然后换算成该算法中的分值,然后在打分。 

--->也许有条件符合评分,譬如权重高的站,匹配度高,带来的复合条件评分,等,这些应该都是有可能的吧!

然后根据这个分值,然后排列出来

猜的,没权威性!!

这篇关于在谷歌搜索,打上自己想要的信息后,到出来搜索结果的流程---------------自己猜的!!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/845269

相关文章

Security OAuth2 单点登录流程

单点登录(英语:Single sign-on,缩写为 SSO),又译为单一签入,一种对于许多相互关连,但是又是各自独立的软件系统,提供访问控制的属性。当拥有这项属性时,当用户登录时,就可以获取所有系统的访问权限,不用对每个单一系统都逐一登录。这项功能通常是以轻型目录访问协议(LDAP)来实现,在服务器上会将用户信息存储到LDAP数据库中。相同的,单一注销(single sign-off)就是指

Spring Security基于数据库验证流程详解

Spring Security 校验流程图 相关解释说明(认真看哦) AbstractAuthenticationProcessingFilter 抽象类 /*** 调用 #requiresAuthentication(HttpServletRequest, HttpServletResponse) 决定是否需要进行验证操作。* 如果需要验证,则会调用 #attemptAuthentica

认识、理解、分类——acm之搜索

普通搜索方法有两种:1、广度优先搜索;2、深度优先搜索; 更多搜索方法: 3、双向广度优先搜索; 4、启发式搜索(包括A*算法等); 搜索通常会用到的知识点:状态压缩(位压缩,利用hash思想压缩)。

hdu1240、hdu1253(三维搜索题)

1、从后往前输入,(x,y,z); 2、从下往上输入,(y , z, x); 3、从左往右输入,(z,x,y); hdu1240代码如下: #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#inc

业务中14个需要进行A/B测试的时刻[信息图]

在本指南中,我们将全面了解有关 A/B测试 的所有内容。 我们将介绍不同类型的A/B测试,如何有效地规划和启动测试,如何评估测试是否成功,您应该关注哪些指标,多年来我们发现的常见错误等等。 什么是A/B测试? A/B测试(有时称为“分割测试”)是一种实验类型,其中您创建两种或多种内容变体——如登录页面、电子邮件或广告——并将它们显示给不同的受众群体,以查看哪一种效果最好。 本质上,A/B测

【北交大信息所AI-Max2】使用方法

BJTU信息所集群AI_MAX2使用方法 使用的前提是预约到相应的算力卡,拥有登录权限的账号密码,一般为导师组共用一个。 有浏览器、ssh工具就可以。 1.新建集群Terminal 浏览器登陆10.126.62.75 (如果是1集群把75改成66) 交互式开发 执行器选Terminal 密码随便设一个(需记住) 工作空间:私有数据、全部文件 加速器选GeForce_RTX_2080_Ti

hdu 4517 floyd+记忆化搜索

题意: 有n(100)个景点,m(1000)条路,时间限制为t(300),起点s,终点e。 访问每个景点需要时间cost_i,每个景点的访问价值为value_i。 点与点之间行走需要花费的时间为g[ i ] [ j ] 。注意点间可能有多条边。 走到一个点时可以选择访问或者不访问,并且当前点的访问价值应该严格大于前一个访问的点。 现在求,从起点出发,到达终点,在时间限制内,能得到的最大

AI基础 L9 Local Search II 局部搜索

Local Beam search 对于当前的所有k个状态,生成它们的所有可能后继状态。 检查生成的后继状态中是否有任何状态是解决方案。 如果所有后继状态都不是解决方案,则从所有后继状态中选择k个最佳状态。 当达到预设的迭代次数或满足某个终止条件时,算法停止。 — Choose k successors randomly, biased towards good ones — Close

hdu4277搜索

给你n个有长度的线段,问如果用上所有的线段来拼1个三角形,最多能拼出多少种不同的? import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamReader;

kubelet组件的启动流程源码分析

概述 摘要: 本文将总结kubelet的作用以及原理,在有一定基础认识的前提下,通过阅读kubelet源码,对kubelet组件的启动流程进行分析。 正文 kubelet的作用 这里对kubelet的作用做一个简单总结。 节点管理 节点的注册 节点状态更新 容器管理(pod生命周期管理) 监听apiserver的容器事件 容器的创建、删除(CRI) 容器的网络的创建与删除