经济观察网 记者 钱玉娟 北京时间5月15日凌晨,被美国人工智能科研机构OpenAI“截胡”的谷歌,如期举办了一年一度的Google I/O 2024(2024谷歌研发者大会,下叫作“谷歌I/O”)。
大会上,谷歌发布了多个新制品、新工具、新功能,包含:最新款大模型Gemini1.5 Pro的上下文窗口从100万tokens(最小输入单元)升级到200万,并推出轻量化模型Gemini 1.5 Flash;推出文生图新模型Imagen 3、音乐创作大模型Music AI Sandbox、视频生成模型Veo;将AI融进了搜索功能,将在美国推出“AI概览”(AI Overviews);发布了AI通用智能体项目Project Astra和谷歌下一代开源模型Gemma2。
倘若无OpenAI“截胡”的话,这将是今年科技圈的“沸点”。
在谷歌I/O前一日,北京时间5月14日凌晨,OpenAI召开了春季发布会。该发布会非常简短,仅花了不到30分钟,宣布了全新旗舰模型GPT-4o,以及在大模型ChatGPT中免费供给更加多功能。但GPT-4o的“类人”响应速度,让观看者感觉VPA(虚拟个人助理)的实现指日可待。这让科技圈提前沸腾了。
宝宝树、米茶公社创始人王怀南熬夜观看了OpenAI的春季发布会。他亦曾是谷歌亚太区CMO(首席营销官)。他叫作,老东家(谷歌)5月14日(美国当地时间)在美国加州召开大型制品发布会,“必定是以AI为主线条的”。在他看来,OpenAI用看似不经意的26分钟,挑战了一家机构一年一度的重大发布,“这是一个四两拨千斤的措施”。
两小时,谷歌连环回击
相比于OpenAI不到30分钟的春季发布会,谷歌I/O花了近两个小时,颁布了多个新制品、新工具。
今年谷歌I/O的主舞台设在了加州海岸线湖公园内的圆形剧场。开幕前一天,谷歌CEO桑达尔·皮查伊(SundarPichai)在台侧拍下一张照片,发出了他的第1篇LinkedIn(领英)帖子,并配文,“迫不及待地想看到这些座位上坐满了来自世界各地的研发者”。
从日前网络上流出的大会关联照片来看,圆形剧场座无虚席。在大会开场,桑达尔·皮查伊亦说,此刻已然有超过150万研发者正在运用谷歌的原生多模态大模型Gemini。
但这场围绕AI的竞赛,还在进行中。
大会上,谷歌宣布诞生一年的Gemini实现着能力跃升,除了1.5 Pro进阶版的上下文窗口拓展至200万个tokens,轻量级模型1.5 Flash的上下文窗口亦达到了100万个tokens。Gemini的功能方面亦有不少拓展,例如移动对话体验,交流更自然,模型亦可引入安卓系统的底层,多模态的Nano版模型还包含诈骗监测等功能。
谷歌还推出Imagen 3、Music AI Sandbox、Veo三个大模型应用。其中视频生成模型Veo能够生成超过一分钟的视频,更加是被视为谷歌反击OpenAI的文生视频大模型Sora的制品。
谷歌还发布了AI通用智能体项目Project Astra和融进了Gemini的搜索功能AI Overviews。
谷歌DeepMind的CEO戴密斯·哈萨比斯(DemisHassabis)首次现身谷歌I/O。他展示了Project Astra(高级视觉和对话响应智能体项目,该项目表率着谷歌对人工智能助手的将来愿景),在展示过程中,他一边实时拍摄一边与手机中的AI Agent(助手)交流,AI Agent展现出多模态理解和实时对话能力。
从大会视频来看,Project Astra的表现不错,虽然它的响应速度比起“与人类的响应时间类似”的GPT-4o要慢有些。倘若不是OpenAI率先发布了GPT-4o,ProjectAstra极有可能是点燃公众对VPA畅想的那一个。
在OpenAI召开春季发布会之前,市场曾广传OpenAI将推出AI搜索功能。但本业是搜索的谷歌,率先将AI功能放进了自己的搜索业务。
谷歌叫作,基于最新版本Gemini,用户能够对搜索引擎提出任何想晓得的事情,或者需要做的事情,例如“寻找波士顿最好的瑜伽或普拉提工作室”,除了给出搜索结果,搜索引擎还能够做工作室介绍,给出门店距离、工作时间等信息;当用户需要“创建一个膳食计划”时,搜索引擎亦能够完成。
“咱们最大的投资和创新行业之一,是咱们的创始制品——搜索。”桑达尔·皮查伊回顾了谷歌创建搜索迄今25年的历史,重点分享了在Gemini变革下,谷歌AI搜索实现的水平提高。
在OpenAI缺席AI搜索赛道之后,谷歌经过AI Overview、“Circle to Secarch”画图即搜功能,以及视频搜索等多个功能的突破,让自家支持多轮推理、规划能力、视频提问等功能的AI搜索,面向市场进行展示,亦给予竞争对手有力的回击。
谷歌的创新危险
尽管亮相了多项更新和多个制品,亦未能完全洗去市场对谷歌创新力的质疑。
接近两个小时的谷歌I/O,谷歌推出的新制品、新工具、新功能,乃至新基建等,总计数目多到超过二十款,亦将谷歌对AI的注重和在AGI(通用人工智能)方向上的发展投入展露无遗。
“(市场侧)对谷歌I/O的反馈都很积极。”一位在谷歌工作十余年的人士叫作。
但王怀南说:“谷歌并无抓到眼球。”大会上,谷歌从CEO到多个制品的总负责人都有出场介绍,OpenAI的春季发布会仅有三个人出场介绍GPT-4o,但在王怀南看来,这三个人就“完全把背面有数百乃至上千人准备的两个小时的谷歌I/O的光芒掩盖掉了”。
王怀南说:“如今的谷歌像极了老微软。”这并不是一个积极的描述。由于对王怀南这种二十数年前从硅谷走出的人来讲,微软“无创新,只懂挣钱,无理想,无使命,制品混乱”。
王怀南看完谷歌I/O后叫作,虽然这次谷歌发布的新制品、新工具、新功能、新基建等数量众多,但发布的制品“全是守护自己的商场利益和守护搜索的制品”。时值如此关键的竞争时点,几乎是“革命的关头”,曾经被视为AI创新标杆的谷歌却用一个守护性的想法,守护着它现有的搜索习惯和搜索的商场模式,这让他想到了当年的微软。
但如今的微软步伐亦轻快了起来。微软不仅巨额投资OpenAI旗下的ChatGPT,还将旗下Bing搜索的服务器、搜索数据乃至算力等倾斜支持OpenAI进行大模型训练,系列投入让微软“跨步走上了AI革命的直通车”。
王怀南叫作,他看到了一个“轻装上阵,不靠搜索吃饭”的微软,乃至发掘那个“老旧的、缓慢的、被动防御的、碎片化的”微软,变得灵活且以用户为导向,这就像过去那个“凭借创新时不时让大众惊艳到难以置信的老谷歌”。
这就让谷歌的劲敌不只是青年的OpenAI,还有正在改变的微软。
当下的谷歌在迸发活力的OpenAI和微软的反衬下,“急需断掉自己创新的原始思维。”但王怀南同期亦叫作,日前谷歌重投AI并进行组织调节的动作,让他看到了想象空间。
搜索引擎起家的谷歌,当前对AI的注重程度亦越来越高。大会现场,谷歌亦统计,桑达尔·皮查伊和戴密斯·哈萨比斯两个小时主题演讲中,提及AI多达121次,Gemini显现的频次并不输于Google一词。
但桑达尔·皮查伊在大会上亦叫作,“日前谷歌仍处在AI平台转型的初期”。出门问问创始人李志飞亦经过社交媒介暗示,眼下的AI产业亦处在初期周期,无论是技术发展还是商场竞争,“离终局还很远”。
李志飞叫作,OpenAI的有些操作“越来越机会驱动”,除了有心机和谷歌抢头条,创始人“言必AGI”的状态亦不被他看好。基于此,他亦叫作,在沿着惯性和顺着势能一路狂奔的路上,OpenAI亦要思虑一下“怎样避免作为AI时代的先烈”。
|