编者按:网站优化时,都会将所有网站的页面链接安置网站地图(Sitemap,专门单独为搜索引擎设置的XML页面)中,并提交给搜索引擎,让搜索引擎能抓取到每一个链接,保证网站的每一个页面都会被搜索引擎给收录。
你的网站/网页是不是被百度抓取,以及被抓取的频率,影响你的排名。
01怎样查看网站被抓取的状况?
首要咱们要晓得,百度抓取一个网页,用到的工具程序是Baiduspider(百度蜘蛛),它的行径动作会被记录在网站日志中,咱们能够从网站日志里Baiduspider(百度蜘蛛)的活跃度:抓取频率,以及抓取后返回的HTTP状态码来查看网站被百度抓取的状况。因此下一步是要找到网站日志的内容。
02网站日志在哪?怎样查看
一般一个网站日志文件在管理后台的logofiles文件夹下面。登陆“FTP”账号,找到一个文件扩展名是.log的日志文件,下载并解压,并将文件改为记事本,这便是网站日志,记录着网站有无被Baiduspider(百度蜘蛛)抓取,是不是抓取成功的状况。
接下来,笔者以这般一段代码来介绍怎样进行log日志分析。例:时间 GET /images/index5_22.gif-- IP位置HTTP/1.1浏览器和操作系统https://www.kedaweilai.com/news/detail/181.html200 360其中,“GET /images/index5_22.gif”表率的是:从服务器上抓取到“/images/index5_22.gif”这个页面或是文件;HTTP/1.1 浏览器和操作系统https://www.kedaweilai.com/news/detail/181.html200 360,表率的是:抓取后返回的状态(是不是成功,抓取数量)200,状态码,暗示成功抓取;360,体积,暗示抓取了多少字节,360个字节;
平常的状态码
200:暗示服务器成功地接受了客户端请求。这是最佳的,暗示网站页面正常。
301:暗示用户所拜访的某个页面已然做了301重定向(永久性)处理。
302:则是暂时性重定向。倘若网站日志分析发掘有太多的302,必须确认是不是将301做错为302。倘若是,赶紧修改,搜索引擎不爱好302重定向。
404:则表率所拜访的页面已然不存在,或是拜访的url基本便是错误的。 500:服务器的错误。03百度蜘蛛的活跃度:抓取频率是什么?
Baiduspider(百度蜘蛛)的活跃度:抓取频率
记录每日的日志里,Baiduspider(百度蜘蛛)抓取网站的次数,再将多日的日志进行对比,来判断当前Baiduspider(百度蜘蛛)的活跃度的高低。活跃度越高,抓取次数越多,说明网站优化有效果,网站排名自然就有所提高。
|