针对网站运营人员而言会尤其关注搜索引擎蜘蛛抓取网站的频率,一旦发掘seo显现问题时运营人员就需要分析网站拜访日志来分析原由。
一个网站每日产生的日志是比较多的,怎样从日志里辨别是不是是百度蜘蛛的请求呢?重点有以下几种方式。
经过UA来辨别百度蜘蛛
UA头信息指的是用户代理信息,里面会记录客户端系统及浏览器的有些信息,倘若UA头信息里显现了Baiduspider 则表率是百度蜘蛛程序发起的请求。
经过源自IP段来辨别百度蜘蛛
百度蜘蛛它是一个综合性蜘蛛程序,它有IP段范围的(如: 220.181.108.75~220.181.108.123), 例如抓取首页的蜘蛛程序用到的IP和抓取内页用到的IP可能是 区别的。
网络上有百度蜘蛛的IP段分布表,大众能够去查下资料,但为了准确性意见向百度官方咨询详细的IP段范围。
查找来访IP绑定的域名
咱们能够经过技术手段查找某个IP与域名的绑定关系,在Windows上可经过nslookup命令来查找。例如咱们从日志里定位到了百度蜘蛛的IP位置,则能够直接以下命令确认是不是绑定的是百度的域名:
总结:无论是经过UA头信息还是IP段来判断某个IP是不是是百度蜘蛛所运用的IP,都存在危害,由于UA头和源自IP都是能够伪造的!
以上便是我的观点,针对这个问题大众是怎么看待的呢?欢迎在下方评论区交流 ~
|