什么是蜘蛛日志?
所说的蜘蛛日志便是当搜索引擎向服务器发送请求时产生的拜访记录文件。
每一个网站都会有日志文件,然则非常多时候,日志文件仅有在网站显现问题的时候才会被查阅。在seo方面,日志文件是更易被忽略的一起,然则日志文件针对seo来讲事非常重要的,咱们能够在日志文件中获取各样信息并发掘网站存在的有些问题。
日志能够去哪里拿到?
日志文件通常是在wwwlog或log这般的文件夹里面能够下载。
分析重点用什么工具?
python和loghao
在日志中能够查看那些数据?
1.客户端的IP位置
2.拜访时间
3.查看http状态码
4.请求方式等等
查看蜘蛛日志常用的有些命令
1.cat access.log | grep Baiduspider 命令来获取百度蜘蛛的仔细爬取记录
2.cat access.log | grep Baiduspider | wc -l 命令来统计百度蜘蛛的爬取次数
3.cat access.log | grep Baiduspider | grep "GET url" 来统计百度蜘蛛爬取某个页面的记录,命令中的url为页面的相对位置。
grep指令用于查询内容包括指定的范本样式的文件,倘若发掘某文件的内容符合所指定的范本样式,预设grep指令会把含有范本样式的那一列表示出来。若不指定任何文件名叫作,或是所给予的文件名为-,则grep指令会从标准输入设备读取数据。在分析日志的时候运用该工具,能够精确找出咱们想看的日志内容,减少筛选时间,提高自己的工作效率。能够按照咱们实质的场景,输入关键词来过滤日志。
蜘蛛日志有何功效?
1.经过对蜘蛛日志的分析,咱们能够晓得蜘蛛是不是对站点进行了抓取,以及抓取是不是成功,判断抓取资源是不是被浪费,亦能够判断咱们的网站是不是符合搜索引擎的抓取规范,找到抓取失败的原由。
2.倘若某个页面被蜘蛛频繁地抓取,咱们能够对这个页面做有些调节(例如布局),能够在页面中添加有些链接。但有些频繁地抓取是蜘蛛恶意的抓取,倘若蜘蛛的拜访频率过高,很可能会影响正常服务的运行,经过对蜘蛛日志的分析,能够发掘恶意蜘蛛的足迹,而后能够限制蜘蛛的拜访频率来保准服务器的稳定。
3.经过分析日志文件,咱们能够发掘蜘蛛的拜访路径,有次咱们能够优化咱们的站点结构。
总结:利用日志咱们能够挖掘到非常多的信息,咱们能够经过日志中的状态码来分析网站是不是存在问题,如是不是存在死链,页面失效等错误。咱们经过日志能够发掘用户对整站页面的拜访次数、拜访时间以及拜访路径,经过这些能够分析用户的行径习惯。经过日志咱们乃至能够防范恶意攻击,因此呢,日志分析在做网站的过程中是必不可少的。
|