学会看出真假百度搜索引擎蜘蛛IP

摘要 : 分析网站日志是SEO人员基本能力,通过网站日志可以反映很多网站表面看不到的情况,比如:有没有404页面,百度,谷歌等搜索引擎有没有来抓取,访问了多少次,什么时候来访问的。

一、看样子凭经验

当我们看的多了有经验了也就能一眼看出哪些是真的百度蜘蛛IP

真蜘蛛官方文档这样记录:

新版移动ua:

Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

PC ua:

Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
所以根据百度的说法,不是长这个样子的就都是假的了,统统拉出去,比如就有一个这样的百度假蜘蛛

假蜘蛛:

Baiduspider+(+http://www.baidu.com/search/spider.htm)

二、通过DOS命令查看

我们通过dos命令来查看,我们来找两个IP段220.181.108.140和117.28.255.37,

开始—运行—输入 cmd ,用命令nslookup +ip 看截图:

如果是真的IP段:

如何分辨真假百度搜索引擎蜘蛛IP

假的:

如何分辨真假百度搜索引擎蜘蛛IP

注意:只要是百度的IP段,代码中会有出现:name:baiduspider,如果没有出现,那就不是真的百度IP

谷歌是一样的:会出现googlebot 其他一样