揭秘百度收录真相!1星期深度探索后,我为么选取放手?seo迷途知返,揭秘哪些让人头疼的爬虫奥密!
微X公众号「雪之梦技术驿站」
致读者: 点击上方 “雪之梦技术驿站” → 点击右上角“ ... ”→ 点选“设为星标★ ” 加上星标,就不会找不到我啦!
引言
俗话说: "最忠实的用户便是爬虫,而爬虫中首推的还是谷歌爬虫."
经过1星期的实测是骡是马已见分晓,百度蜘蛛是真的不太行,最少对我网站是这般,若是有所可疑请跟我一块瞧瞧复现过程.
以上来自于个人服务器Nginx日志实时监听大屏,请参考以下文案:
解锁Nginx日志的宝藏:GoAccess——你的实时、交互式Web日志分析神器!
从最初的第二名拜访量如今已然跃居第1名,其中少不了主动向百度和谷歌收录网站各自推送网站,当然我对百度是一如初见,而百度对我却不屑一顾.
对比一下谷歌收录效果,不仅被收录了还有用户拜访,真的不要太显著啊!
教你两步实现个人网站被谷歌快速收录
因此,百度你到底行不行啊?全部的过程再次复盘总结一下,期盼得到同频好友的交流帮忙.
现象
浏览器直接查询站点收录状况:site:blog.snowdreams1006.cn
不论是主动提交到百度资源搜索平台还是加入了百度统计平台数据分析,都是惨淡空数据.
复现
百度搜索资源平台[1]-资源提交-普通收录
API提交
当日运用api接口当日提交了10条链接,次日查找已然能看到统计结果,但实质上次日发掘site:blog.snowdreams1006.cn并无被百度收录.
更新: 过了快一个礼拜依然是仅有一条收录记录,数据惨淡.
手动提交
为了实验的准确性,于是次日仅仅手动提交了10条链接,等待次日查找统计结果以及再次确认site:blog.snowdreams1006.cn收录状况.
等待次日已然统计出来了手动提交的记录,我以为会有所改观,然而现实告诉我: 不要有不切实质的期待!
不出意外的是,site:blog.snowdreams1006.cn依然无被百度收录,看样子提交后并无被收录.
抓取诊断
既然普通收录的三种方式均已然尝试过况且无什么效果,依然仅有一条记录,还是之前抓取诊断的记录.
于是科研了网站的各个菜单功能,发掘了抓取诊断能不可有用?
每一个站点每周可运用70次,抓取结果只展现百度蜘蛛可见的前200KB内容.
再次实时验证site:blog.snowdreams1006.cn依然是收录1条,等待次日或更久的时间再来看一下.
火速时间来到了次日,依然如此,放弃了,爱咋咋地吧!
总结
前前后后实验了快1星期的时间,真没想到百度令我大失所望,无反馈亦无数据,真的心累了!
结论: 新网站注册百度搜索资源平台[2],添加站点后普通收录短期内无反应,当然亦有可能是个例吧.
不论是普通收录的api提交方式还是手动提交或抓取诊断等方式均无实质功效,最后吐槽一下真比不外谷歌收录.
因此,放弃百度收录,只好随他自己去吧,说不定哪天一时兴起再次想起来曾经注册过,统计过亦会有一种时过境迁的感觉吧!
往期精彩文案
谁家爬虫这么明目张胆?连UserAgent都不要了!解锁Nginx日志的宝藏:GoAccess——你的实时、交互式Web日志分析神器!重装系统之必装神器!错失它们?你的电脑将失去灵魂!<黑神话:悟空>:国产游戏的震撼崛起爱情年龄差背面的奥密每日一道美味佳肴《糖醋排骨》
欢迎扫码关注
微X公众号「雪之梦技术驿站」
欢迎扫码关注,私信回复『加群』一块交流技术
参考资料
[1]
百度搜索资源平台-资源提交-普通收录: https://ziyuan.baidu.com/dashboard/index?site=https://blog.snowdreams1006.cn/
[2]
百度搜索资源平台: https://ziyuan.baidu.com/dashboard/index?site=https://blog.snowdreams1006.cn/
|