在科技界,信息泄密事件屡见不鲜,但某些时候,规模和影响范围难以估量的泄密事件会出现,足以改变全部行业的格局。
当这般的事件触及到谷歌这般的行业巨头,并揭露全世界最大互联网搜索引擎运作的奥密时,自然吸引了所有人的目光。谷歌常常徘徊在重大决策与危险管理之间,在超过2500页的seo文档泄密后,谷歌被迫采取紧急应对办法。
今年五月初,市场科研网站SparkToro的联合创始人兰德·费什金(Rand Fishkin)收到了匿名寄送的数千份谷歌搜索API文档泄密资料,其中揭露了该机构搜索业务的敏锐信息。尽管泄密数据中包括海量技术细节,但Rand Fishkin和iPullRank的创始人迈克·金(Mike King)审查后发掘,这些文件不仅包括了以前不为人知的信息,况且最关键的是,它们都是真实可信的。
泄密的文件不包括代码等内容,而是描述了怎样运用谷歌搜索内部API;泄密的文档中多次提及内部系统和项目。尽管有一个名叫作类似的谷歌云API已然公开,但GitHub上泄密的内容似乎远不止于此。
超过2500页的文档中,有超过14000个与API关联或可拜访的属性的仔细信息,但关于是不是运用了所有这些信号以及它们的重要性,信息很少。因此呢,很难确定谷歌在其搜索结果排名算法中对这些属性的注重程度。
Fishkin解释道:“Azimi邮件中说到的许多说法直接与谷歌数年来发布的公开声明相矛盾,尤其是谷歌一再否认运用点击为中心的用户信号、否认在排名中单独思虑子域名、否认对新网站有沙盒效应、否认收集或思虑域名年龄等。”
King引用了谷歌搜索倡导者约翰·穆勒 (John Mueller)的声明,Mueller在一个视频中暗示“咱们无像网站权威分数这般的东西”。但King指出,文档表示做为压缩质量信号的一部分,谷歌确实会计算“网站权威”分数。
另外,文档还揭示了点击量的重要性,区别类型点击(好的、坏的、长期的)在网页排名中的决定功效。谷歌曾承认,它将点击量指标做为网络搜索的排名原因。另一个发掘是,谷歌将经过Chrome浏览器查看的网站做为质量信号,以及思虑内容鲜嫩度、作者身份、页面与网站中心主题的关联性、标题与内容的一致性,乃至是文档主体中术语平均加权字体体积等原因。
在帖子发布后,谷歌向The Register回复叫作,公众应保持冷静,并认识到意外泄密的文件可能缺乏关键的上下文。一位谷歌发言人暗示:“咱们提醒大众不要按照脱离上下文、过时或不完整的信息对搜索做出不准确的假设,”一位发言人暗示。“咱们已然分享了关于搜索工作原理以及咱们系统权衡的原因类型的广泛信息,同期亦在奋斗守护咱们结果的完整性免受操作。”
近年来,AT&T与T-Mobile先后遭遇大规模用户数据被盗事件。在T-Mobile的案例中,乃至惊动了当地政府的介入。社交媒介平台X(原Twitter)亦在2022年遭遇了零日漏洞攻击,引起540万个账户受到影响。有时,泄密事件对涉事机构未必全是消极影响;例如近期的谷歌Pixel 9系列泄密,或许还能为制品预热,最少能让机构借此机会测试公众对其决策的反应。
尽管与其他搜索引擎相比,谷歌搜索的用户数量惊人,但将来可能会迎来OpenAI这个强劲对手的竞争。谷歌仍在向搜索结果中添加AI元素,这是其全面整合Gemini系统计划的一部分。竞争总是有益的,尤其在谷歌关闭搜索中的缓存链接功能后,针对有些用户来讲,新的竞争者显现正是时候。
参考链接:
https://www.androidpolice.com/massive-leak-google-seo-data/https://www.theregister.com/2024/05/29/internal_google_search_documents/返回外链论坛:www.fok120.com,查看更加多
责任编辑:网友投稿
|