外链论坛

 找回密码
 立即注册
搜索
查看: 2|回复: 0

网站被百度抓取,怎么查看?

[复制链接]

655

主题

0

回帖

9957万

积分

论坛元老

Rank: 8Rank: 8

积分
99578266
发表于 前天 02:47 | 显示全部楼层 |阅读模式

百度用于抓取网页的程序叫做Baiduspider - 百度蜘蛛,咱们查看网站被百度抓取的状况重点是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

怎样查看网站被百度抓取的状况

查看日志的方式:

经过FTP,在网站根目录找到一个日志文件,文件名通常包括log,下载解压里面的记事本,这即是网站的日志,记录了网站被拜访和操作的状况

由于各个服务器和主机的状况区别区别的主机日志功能记录的内容区别,有的乃至日志功能。
照片源自网络

日志内容如下:

61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /bbs/thread-7303-1-1.html HTTP/1.1" 200 8450 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)"

分析:

GET /bbs/thread-7303-1-1.html 表率,抓取/bbs/thread-7303-1-1.html 这个页面。

200 表率成功抓取。

8450 表率抓取了8450个字节。

倘若你的日志里格式不是如此,则表率日志格式设置区别

非常多日志里能够看到 200 0 0和200 0 64 则都表率正常抓取。

抓取频率是经过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并一个规范的时间表或频率数字,咱们通常经过多日的日志对比来判断。当然,咱们期盼百度蜘蛛每日抓取的次数越多越好。

在网站显现问题的状况下,经过查看网站日志,查看网站的HTTP返回值是不是正常。

以上便是网站被百度抓取,怎么查看?

》的所有内容,感谢阅读,期盼对你有帮忙

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|外链论坛 |网站地图

GMT+8, 2024-7-6 17:09 , Processed in 0.112241 second(s), 20 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.