外链论坛

 找回密码
 立即注册
搜索
查看: 6|回复: 0

百度会收录网站里的每一个页面吗?查询网站是不是被百度抓取的办法

[复制链接]

707

主题

0

回帖

9778万

积分

论坛元老

Rank: 8Rank: 8

积分
97788074
发表于 前天 02:30 | 显示全部楼层 |阅读模式

编者按:网站优化时,都会将所有网站的页面链接安置网站地图(Sitemap,专门单独为搜索引擎设置的XML页面)中,并提交给搜索引擎,让搜索引擎能抓取到每一个链接,保证网站的每一个页面都会被搜索引擎给收录。

你的网站/网页是不是被百度抓取,以及被抓取的频率,影响你的排名。

01怎样查看网站被抓取的状况

首要咱们晓得,百度抓取一个网页,用到的器具程序是Baiduspider(百度蜘蛛),它的行径动作会被记录在网站日志中,咱们能够从网站日志里Baiduspider(百度蜘蛛)的活跃度:抓取频率,以及抓取后返回的HTTP状态码来查看网站被百度抓取的状况因此下一步是要找到网站日志的内容。

02网站日志在哪?怎样查看

一般一个网站日志文件在管理后台的logofiles文件夹下面。登陆“FTP”账号,找到一个文件扩展名是.log的日志文件,下载并解压,并将文件改为记事本,这便是网站日志,记录着网站有被Baiduspider(百度蜘蛛)抓取,是不是抓取成功的状况

接下来,笔者以这般一段代码来介绍怎样进行log日志分析。例:时间 GET /images/index5_22.gif-- IP位置HTTP/1.1浏览器和操作系统https://www.kedaweilai.com/news/detail/181.html200 360其中,“GET /images/index5_22.gif”表率的是:从服务器上抓取到“/images/index5_22.gif”这个页面是文件;HTTP/1.1 浏览器和操作系统https://www.kedaweilai.com/news/detail/181.html200 360,表率的是:抓取后返回的状态(是不是成功,抓取数量)200,状态码,暗示成功抓取;360,体积,暗示抓取了多少字节,360个字节;

平常的状态码

200:暗示服务器成功地接受了客户端请求。这是最佳的,暗示网站页面正常。

301:暗示用户所拜访的某个页面已然做了301重定向(永久性)处理。

302:则是暂时性重定向。倘若网站日志分析发掘太多的302,必须确认是不是将301做错为302。倘若是,赶紧修改,搜索引擎不爱好302重定向。

404:则表率拜访的页面已然不存在,拜访的url基本便是错误的。

500:服务器的错误。

03百度蜘蛛的活跃度:抓取频率是什么?

Baiduspider(百度蜘蛛)的活跃度:抓取频率

记录每日的日志里,Baiduspider(百度蜘蛛)抓取网站的次数,再将多日的日志进行对比,来判断当前Baiduspider(百度蜘蛛)的活跃度的高低。活跃度越高,抓取次数越多,说明网站优化有效果,网站排名自然就有所提高

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|外链论坛 |网站地图

GMT+8, 2024-7-6 16:49 , Processed in 0.108050 second(s), 20 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.