什么是百度抓取诊断?
抓取诊断工具,能够让站长从百度蜘蛛的视角查看抓取内容,自助诊断百度蜘蛛看到的内容,和预期是不是一致。每一个站点每周可运用70次,抓取结果只展现百度蜘蛛可见的前200KB内容。
抓取诊断工具能做什么?
日前抓取诊断工拥有如下功效:
1、诊断抓取内容是不是符合预期,譬如非常多商品详情页面,价格信息是经过JavaScript输出的,对百度蜘蛛不友好,价格信息较难在搜索中应用。问题修正后,可用诊断工具再次抓取检验。
2、诊断网页是不是被加了黒链、隐匿文本。网站倘若被黑,可能被加上隐匿的链接,这些链可能仅在百度抓取时才显现,必须用此抓取工具诊断。 3、检测网站与百度的连接是不是畅通,若是IP信息不一致,可以报错通告百度更新IP。
抓取诊断工具平常错误类型解析
【url规范】
百度支持抓取的url长度不超过1024,倘若您的链接长度过长,请在保准正常拜访的状况下,适当精简,保准链接能被百度正常抓取和收录。
【重定向错误】
重定向指的是百度spider拜访链接时出现了转,倘若转后的链接超长或连续转的次数超过5次,就会出现重定向错误而引起抓取失败。
【服务器连接错误】
这种状况指的是,因为服务器响应过慢或您的网站屏蔽了百度spider,而引起百度没法拜访您的网站。从而会引起百度没法正常收录或更新您网站的内容。您可能看到以下详细错误:连接超时、连接失败、连接被拒、没响应、响应遭到截断、连接重置、标头遭到截断、超时。
*怎样处理服务器连接错误?
减少动态网页请求的太多网页加载。倘若网站为多个网址供给相同内容,则会被视为动态供给内容(例如,http://www.example.com/shoes.php?color=red&size=7与http://www.example.com/shoes.php?size=7&color=red供给的内容相同)。动态网页的响应时间可能会很长,并会因此呢引起超时问题。或,服务器可能会返回超载状态,需求百度spider放慢抓取该网站的速度。通常来讲,意见您尽可能运用简短的参数并小心运用。
保证您网站的托管服务器无停止运行、超载或配置欠妥。倘若连接问题、超时问题或响应问题仍然存在,请与您的网站托管服务供给商联系,并思虑加强您的网站处理流量的能力。 检测网站是不是不小心屏蔽了百度spider的IP。您可能会因为系统级问题而阻止了百度拜访,例如DNS配置问题、配置欠妥的防火墙或DoS防护系统、内容管理系统配置问题。防御系统是保准托管服务正常运行的重要原因之一,并且这些系统一般会配置为自动阻止超量的服务器请求。因为百度spid
|