打不外,就加入。 Stack Overflow,一个类似知乎、Reddit的老牌网站,因专注于技术问答和社区运营,因此呢在全世界程序员圈内备受欢迎。
然而自从ChatGPT面世败兴,该网站的拜访量和搜索量都在短期里骤降,众多程序员起始放弃运用。
为了挽留住用户,Stack Overflow先是封杀ChatGPT,紧接着推出自研AIGC制品,但接二连三的“自救”依然止不住流量的大幅下降。
令人惊讶的是,Stack Overflow忽然在本周一宣布与OpenAI签定协议,为其供给数据。
有意思的是,Stack Overflow不仅与OpenAI合作,其丰富的数据亦被谷歌的Gemini模型买走。
程序员最大的问答网站,挡不住AI
在程序员圈里,Stack Overflow地位有多高?
简单点说,做为一家老牌问答网站,Stack Overflow已然成立了16年、最高时每月都有2亿台主机拜访。
没论一线大厂技术大佬,还是刚入门的计算机小白,只要提出了编程问题,总会有网友挺身而出,供给思路,乃至直接给出最优解的答案。
正是由于有着庞大的数据,Stack Overflow虽然名气比不上Reddit,但亦算是圈内人的必须网站。
但事情在ChatGPT横空出世后,起始朝着衰落的方向发展。
在 ChatGPT上线后,快速有网友发掘其出色的代码生成能力,因此呢“ChatGPT能够取代Google、Stack Overflow”的言论吸引了大批程序员的目光。
然而令人没想到的是,仅仅上线5天后,Stack Overflow反手就把 ChatGPT 给封杀了。
原由是ChatGPT生成的代码错得过于离谱,因此呢Stack Overflow宣布这些生成垃圾答案的账号都会被封号。
有意思的是,Stack Overflow团队发掘,非常多用来训练AI模型的数据,其实便是来自Stack Overflow。
倘若放任AI设备人生成垃圾回答,那不就等于搬起石头砸自己的脚吗?
虽然Stack Overflow的表态很知道,广大程序员们亦能理解,但奈何ChatGPT的体验实在是真香!
最后,面对AI的强势来袭,Stack Overflow的流量亦是越来越差,到了2023年6月,浏览量几乎已然是腰斩。
为了止住颓势,Stack Overflow 起始是一系列办法。
先是在7月,技术团队利用自家5800万个问题和答案的数据库,做了一款名为「OverflowAI」的AI 工具,其功能重点围绕着编程,但无掀起太大的水花。
到了10月,机构CEO宣布解雇了约28%的员工,经过缩减营销预算的方式,为 AI工具连续输血。
不外因为OverflowAI还处在初级测试周期,面对实力强劲且持续进化的ChatGPT,OverflowAI能做的仅仅是拖延Stack Overflow衰落的速度。
卖数据,真香
在面对ChatGPT的威胁时,Stack Overflow一起始选择运用“防御”的姿态。
但殊不知,这些公开的互联网数据早已被OpenAI等科技机构用“爬虫”等手段进行搜刮,自己不仅要面临用户的流失,更要面临数据的流失。
不外毕竟日拜访量摆在那里,Stack Overflow手握着海量优秀的数据,倒亦作为一笔能够交易的资源。
自《纽约时报》带头起诉OpenAI后,越来越多的资讯媒介和门户网站加入到讨伐OpenAI的队伍中。
在面对版权问题时,科技机构们只能乖乖掏钱为训练数据付费,并承诺不会运用私人数据。
Reddit、Youtube、ShutterStock、Photobucket等网站都是数据交易的受益者,手握许多优秀的训练材料,科技巨头们花起钱来亦是毫不吝啬。
相比之下,Stack Overflow的数据一样出色,乃至比Reddit这般的综合性网站更加专业。
因此呢,Stack Overflow CEO亦起始学会了向各大科技机构推销自家数据,其中就包含了Google的 Gemini 模型。
或许正是看到了科技机构针对优秀数据的巴望,让高层选取来了一次360度的态度大转变,既然用户是回不来了,那最少把钱赚到口袋里。
值得一提的是,Stack Overflow当时强调,该协议并不拥有排他性,这就寓意着任何科技机构都能够购买一样的数据,剩下就看哪家训练得更好。
据报告叫作,Stack Overflow 的技术内容将与 OpenAI 的 GPT-4 等模型相结合,经过OverflowAPI拜访,将来研发者能够直接经过 OpenAI得到靠谱且经过验证的数据,并帮忙她们快速找到处理繁杂问题的办法。
而Stack Overflow 亦能从研发社区收集反馈,保证 AI 研发工具连续改进。
简单点便是说,Stack Overflow与 OpenAI来了一次技术和数据的互换,前者加强了AI能力,后者得到了靠谱的数据,两者双赢。
据说,此次合作将带来的第1组集成功能和能力,预计将于 2024 年上半年发布,这亦说明双方的合作其实已然进行了很久。
隐私还是大问题?
日前,越来越多的社区网站起始加入到AI训练中,包含百度贴吧的“弱智吧”,在一次科研里显现出不俗的数据训练效果,一度冲上热搜。
针对拜访量持续下降的传统内容网站们,优秀的数据确实是一个能够长时间进行的“副业”。
另一,AI固然很香,但不是无缺点。
自Stack Overflow起始转向研发AI能力后,研发者社区的有些成员对这一变化暗示反对,她们对人工智能生成的信息的有效性、以及数据隐私暗示担忧。
亦有专家指出,AI会引起更加多错误代码被推送到代码库中,乃至放大软件项目中现有的漏洞和安全问题。
但针对“饥渴”的AI机构们,持续膨胀的数据消耗问题已然足够头疼。
而网站的帮忙,刚好能够为自己分担有些危害。
本文作者:jh,观点仅表率个人,题图源:网络返回外链论坛:www.fok120.com,查看更加多
责任编辑:网友投稿
|