SEO:搜索引擎蜘蛛名称UA(user-agent)

2024-05-16 06:52

本文主要是介绍SEO:搜索引擎蜘蛛名称UA(user-agent),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

最近网站在做统计功能,想着统计下蜘蛛爬行记录,看看都有哪些搜索引擎蜘蛛经常关顾,故而好进行相应的对策改变。都知道搜索引擎对一个网站很重要,是很多网站重要的流量来源。熟悉各大搜索引擎的蜘蛛就显得必要。

做SEO优化的通常会说蜘蛛爬得越勤快,网页收录也快。通过分析网站访问日志:查看访问者的user-agent,我们就可以了解哪些搜索蜘蛛过来爬行过网站页面了,下面整理一下国内常用的一些搜索蜘蛛


1、 百度蜘蛛:Baiduspider Baiduspider-image baiduboxapp Baiduspider-render

百度搜索资源平台_共创共享鲜活搜索

2、 谷歌蜘蛛:Googlebot (很勤奋的蜘蛛) Googlebot-Image Google-Read-Aloud Googlebot-Video

谷歌中文站长平台  >> 需要翻墙

3、 360蜘蛛:360Spider (比较懒的蜘蛛)

360站长平台-站长平台

4、 搜狗蜘蛛:SogouSpider, Sogou web spider

搜狗资源平台_公平开放的交流平台

5、 神马蜘蛛:YisouSpider (UC浏览器默认搜索sm.cn的蜘蛛)

神马站长平台

6、 必应蜘蛛:bingbot BingPreview

必应

7、 有道蜘蛛:YoudaoBot,YodaoBot(找不到)

8、 MSN蜘蛛:msnbot,msnbot-media

9、 雅虎蜘蛛:“Yahoo! Slurp China”或者Yahoo!(找不到)

10、 Yandex蜘蛛:YandexBot (俄罗斯搜索引擎)

Oops, Captcha!  >> 需要翻墙

11、 DNSPOD监控蜘蛛:DNSPod-Monitor

12、 MJ12bot:MJ12bot (英国SEO分析页面蜘蛛)

13、 SEMrush:SemrushBot (美国SEO综合分析网站的蜘蛛)

Semrush - 在线营销简单方便

14、 头条蜘蛛:Bytespider (今日头条旗下:高频抓取 被很多站长封禁后 有所改善)

头条搜索站长平台

15、 华为蜘蛛:AspiegelBot ( 华为旗下Aspiegel公司 疯狂高频爬行无节制 )

对于国内中文用户为主的站长主要使用 百度、Sogou搜狗、Bing、360搜索、神马、头条

对于大陆中文网站站长主要是 百度、360搜索和头条搜索,其它的可有可无

若是网站客户来源,手机端特别多,建议神马的不要禁止,毕竟UC的用户也有不少。

特别推荐屏蔽,甚至是拉进黑名单的:Yandex  MJ12bot  SEMrush,至于AspiegelBot需要看日志在决定,搞完之后能省下来不少性能和流量。

这篇关于SEO:搜索引擎蜘蛛名称UA(user-agent)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/994187

相关文章

flume系列之:记录一次flume agent进程被异常oom kill -9的原因定位

flume系列之:记录一次flume agent进程被异常oom kill -9的原因定位 一、背景二、定位问题三、解决方法 一、背景 flume系列之:定位flume没有关闭某个时间点生成的tmp文件的原因,并制定解决方案在博主上面这篇文章的基础上,在机器内存、cpu资源、flume agent资源都足够的情况下,flume agent又出现了tmp文件无法关闭的情况 二、

zblog自定义关键词和描述,zblog做seo优化必备插件

zblog自定义关键词和描述,zblog做seo优化必备插件     首先说下用到的一款插件:CustomMeta自定义数据字段 ,我们这里用到的版本是1.1,1.1+版增加了列表页标签支持!     插件介绍:文章,分类等添加自定义数据字段。1.1+版适用于 Z-Blog 2.0 B2以上版本。     在zblog2.0beta1里面,这个插件是集成到了程序里面,beta2里面默认没有了

Oracle 查看表空间名称及大小和删除表空间及数据文件方法

--1、查看表空间的名称及大小  SELECT t.tablespace_name, round(SUM(bytes / (1024 * 1024)), 0) ts_size  FROM dba_tablespaces t, dba_data_files d  WHERE t.tablespace_name = d.tablespace_name  GROUP BY t.tablespace_na

HTTP 状态码:它们如何影响 SEO?

HTTP状态码在网站的功能和性能中扮演着重要角色,但它们的影响不仅限于技术层面。当涉及到SEO时,理解HTTP状态码变得至关重要。 这些状态码对于搜索引擎来说非常重要,因为它们可以影响Google如何有效地抓取和索引您的页面。 在本文中,我们将探讨: 什么是HTTP状态码(以及它们如何工作)。单个状态码如何影响您的SEO努力。如何检查(和修复)您网站上的HTTP状态码。 什么是HTTP状态

Java应用对接pinpoint监控工具的时候,应用名称长度超出限制而导致接入失败

一、背景 java应用需要接入pinpoint,同一个虚拟机上的其他应用接入成功,唯独本应用不行。 首先排除是pinpoint agent的问题,因为其他应用都正常。 然后,我就对比二者的启动脚本。 -javaagent:/opt/pinpoint/pinpoint-bootstrap.jar -Dpinpoint.agentId=DA301004_17 -Dpinpoint.applic

【JavaScript】方法属性的匿名函数是匿名函数么(附:获取当前执行函数名称的方法)

var ninja = {shout: function(){console.log("hello");}}   有些人可能认为,将匿名函数赋值给名为shout的属性也就相当于给它取了名字,其实这是不正确的理解。shout是属性的名称,而不是函数自身的名称。这一点可以通过检查函数的name属性来验证。 下面是一些测试实例,请自行思考(前两个均为匿名函数):

某城user_dun,js逆向分析

声明: 该文章为学习使用,严禁用于商业用途和非法用途,违者后果自负,由此产生的一切后果均与作者无关。 本文章未经许可禁止转载,禁止任何修改后二次传播,擅自使用本文讲解的技术而导致的任何意外,作者均不负责,若有侵权,请联系作者立即删除! 前言 这次会简单的讲解某城ly headers中参数userdun的逆向分析流程以及简单的补环境,如果有疑问可以在评论区交流讨论,我看到会及时回复的,另外,有

user is not in the sudoers file

出现这种情况是因为用户user没有sudo权限。解决办法自然是将当前用户添加到sudo成员中。  1.以root身份登录。 2.更改文件权限:  # chmod u+w /etc/sudoers  3.在/etc/sudoers文件中,root ALL=(ALL)ALL下方添加: user ALL=(ALL)ALL 保存退出。 4.还原文件权限:  # chmod u-w /etc

AGENT时区问题

1、因agent的时区与machine时区不匹配导致启动agent失败,解决在安装检查时区的检查的警告问题 解决问题:在利用12c MOS推送方式安装12c agent时,会出现时区检查的warning,上面提示利用emctl resetTZ agent在安装后处理。在做的过程中,可能遇到某些状况的解决方法 环境:HP_UNIX B.11.31 --查看agent状态 $ ./emctl stat

【python 爬虫】伪造UA字符串

写好爬虫的原则只有一条: 就是让你的抓取行为和用户访问网站的真实行为尽量一致。 1、伪造UA字符串,每次请求都使用随机生成的UA。 为了减少复杂度,随机生成UA的功能通过第三方库fake-useragent实现 pip install fake-useragent 2、生成一个UA字符串只需要如下代码: 核心代码: from fake_useragent import UserAge