百度用于抓取网页的程序叫做Baiduspider - 百度蜘蛛,咱们查看网站被百度抓取的状况重点是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。
怎样查看网站被百度抓取的状况? 查看日志的方式:
经过FTP,在网站根目录找到一个日志文件,文件名通常包括log,下载解压里面的记事本,这即是网站的日志,记录了网站被拜访和操作的状况。 由于各个服务器和主机的状况区别,区别的主机日志功能记录的内容区别,有的乃至无日志功能。
照片源自网络日志内容如下: 61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /bbs/thread-7303-1-1.html HTTP/1.1" 200 8450 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)"
分析:
GET /bbs/thread-7303-1-1.html 表率,抓取/bbs/thread-7303-1-1.html 这个页面。
200 表率成功抓取。 8450 表率抓取了8450个字节。
倘若你的日志里格式不是如此,则表率日志格式设置区别。 非常多日志里能够看到 200 0 0和200 0 64 则都表率正常抓取。
抓取频率是经过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并无一个规范的时间表或频率数字,咱们通常经过多日的日志对比来判断。当然,咱们期盼百度蜘蛛每日抓取的次数越多越好。
在网站显现问题的状况下,经过查看网站日志,查看网站的HTTP返回值是不是正常。
以上便是《网站被百度抓取,怎么查看?
》的所有内容,感谢阅读,期盼对你有帮忙!
|