网站的seo优化过程中难免会分析网站日志,网站日志的分析和诊断就像给网站看病同样,咱们经过网站日志的分析,能够更加清楚的晓得网站的健康情况,运用这些数据更有利于开展网站SEO优化。
经过网站日志能够清楚的得知用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率表示器的状况下拜访了你网站的哪个页面,是不是拜访成功。针对专业从事搜索引擎优化工作者而言,网站日志能够记录各搜索引擎蜘蛛设备人爬行网站的仔细状况,例如:哪个IP的百度蜘蛛设备人在哪天拜访了网站多少次,拜访了那些页面,以及拜访页面时返回的HTTP状态码。
平常的蜘蛛名叫作:
Baiduspider:百度蜘蛛
Baiduspider-Image:百度照片蜘蛛
Googlebot:谷歌设备人
Googlebot-Image:谷歌照片设备人
360Spider:360蜘蛛
sogou spider:搜狗蜘蛛
1、网站日志的功效
1、经过网站日志能够认识蜘蛛对网站的基本爬取状况,能够晓得蜘蛛的爬取轨迹和爬取量。
2、网站的更新频率亦和网站日志中蜘蛛抓取的频率相关,通常来讲更新频率越高,蜘蛛的抓取频率越高,而咱们网站的更新不仅只是新内容的添加同期还有咱们的微调操作。
3、咱们能够按照网站日志的反应状况,对咱们的空间的某些事情和问题提前进行预警,由于服务器倘若出问题的话在网站日志中会第1时间反映出来,要晓得服务器的稳定速度和打开速度两者都会直接影响咱们的网站。
4、经过网站日志咱们能够晓得网站的哪些页面是很受蜘蛛欢迎的,而那些页面是蜘蛛连碰都不去碰的,同期咱们还能发掘有有些蜘蛛因为是过度爬取对咱们的服务器资源损耗是很大的,咱们要进行屏蔽工作。
2、怎样下载网站日志
1、首要咱们的空间要支持网站日志下载,这一点是很要紧的,在购买空间时候需事先认识下是不是支持日志下载,由于有的服务商是不供给这项服务的,倘若支持的话空间后台通常都有日志WebLog日志下载这个功能把它下载到根目录在用FTP传到本地就能够,服务器的话能够设置将日志文件下载到指定路径。
2、这儿有个很要紧的问题,网站日志剧烈意见设置成每小时生成一次,小型的公司站和页面内容较少的网站能够设置成一天,它默认是一天,倘若内容多或大型站设置成一天生成一次,那样一天只生成一个文件,这个文件会相当的大,咱们有时电脑打开是会导致死机,设置的话找空间商协调设置就可。
3、网站日志数据分析
1、网站日志中数据量过大,因此咱们通常必须借助网站日志分析工具来查看。常用的日志分析工拥有:光年日志分析工具、web log exploer、WPS表格等
117.26.203.167 - - [02/May/2011:01:57:44 -0700] "GET/index.php HTTP/1.1" 500 19967 "-" "Mozilla/4.0 (compatible; MSIE 8.0;Windows NT 5.1; Trident/4.0; AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa Toolbar)"
分析:
117.26.203.167拜访ip;
02/May/2011:01:57:44 -0700拜访日期 -时区;
GET/index.php HTTP/1.1按照HTTP/1.1协议抓取(域名下)/index.php这个页面(GET暗示服务器动作);
500服务器响应状态码;
服务器响应状态码一般状态码有以下几种:200,301,302,304,404,500等。200表率用户成功的获取到了所请求的文件,倘若是搜索引擎,则证明蜘蛛在这次爬行中顺利的发掘了有些新的内容。而301则表率用户所拜访的某个页面url已然做了301重定向(永久性)处理,302则是暂时性重定向。404则表率所拜访的页面已然不存在了,或说拜访的url基本便是个错误的。500则是服务器的错误。
19967暗示抓取了19967个字节;
Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa Toolbar暗示拜访者运用火狐浏览器及Alexa Toolbar等拜访端信息;
2、倘若你的日志里格式不是如此,则表率日志格式设置区别。
3、非常多日志里能够看到 200 0 0和200 0 64则都表率正常抓取。
4、抓取频率是经过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并无一个规范的时间表或频率数字,咱们通常经过多日的日志对比来判断,当然,咱们期盼百度蜘蛛每日抓取的次数越多越好。
5、有时候咱们的路径不统一显现带斜杠和不带斜杠的问题,蜘蛛会自动识别为301转到带斜杠的页面,这儿咱们就发掘了搜索引擎是能够判断咱们的目录的,因此咱们要对咱们的目录进行统一。
6、咱们分析日志分析时间长了,咱们能够看出蜘蛛的抓取规律,同一目录下面的单个文件的抓取频率间隔和区别目录的抓取频率间隔都能够看出来,这些抓取频率间隔时间是蜘蛛按照网站权重和网站更新频率来自动确定的。
7、蜘蛛针对咱们的页面的抓取是分等级的,是按照权重依次递减的,通常次序为首页、目录页、内页。
4、经过网站日志咱们能晓得什么?
1、咱们买的空间是不是能够稳定?
2、蜘蛛对咱们的哪些页面比较爱好而对那些不爱好?
3、蜘蛛什么时候抓取咱们的网站频繁,咱们必须什么时候更新内容?
总结:
因此不管是新站还是老网站,不管你做百度还是Google咱们都能经过网站日志分析出来搜索引擎蜘蛛抓取的状况;倘若网站长期收录有问题,那样咱们亦能够对比网站日志中的搜索引擎蜘蛛行径,来认识网站是哪方面出了问题;倘若网站被封,或被K,咱们都能够经过观察网站日志的状况来认识原由出在什么地区。咱们要看的网站日志的分析和诊断就像给网站看病同样,咱们经过网站日志的分析,能够简单明了的就晓得网站的健康情况,能够利于咱们更好的做网站优化,因此针对真正的SEO能手而言,分析蜘蛛日志是最直观,最有效的额。
微X公众号(xiaomzmt)非知名草根自媒介,IT博主,SEO,网络营销干货铺!来源:www.xiaomseo.com
|