外链论坛

 找回密码
 立即注册
搜索
查看: 6|回复: 3

谷歌怒发十几款AI新品,但最出圈的专题还是「翻车」

[复制链接]

3132

主题

3万

回帖

9996万

积分

论坛元老

Rank: 8Rank: 8

积分
99968646
发表于 2024-7-30 23:52:37 | 显示全部楼层 |阅读模式

一年一度的Google I/O研发者大会如期而至,在本场发布会中,谷歌一口气交出数个AI新品,轮番轰炸咱们的视觉神经。

首要是真正道理上的全新制品——Google AI Overviews,这是一项基于大模型技术研发的全新搜索引擎,旨在以聊天的方式为用户供给精细有效的搜索结果。没错,传闻中OpenAI正集全力要打造的便是这玩意儿。

(图源:Google)

一样与搜索相关的还有「Ask Photos」,相比起AI Overviews,它更专注于图像理解与图像信息捉捕,这寓意此刻能够经过文字描述的方式,找到藏在相册里的哪些被遗忘已久的照片。

还记得前天夜晚OpenAI发布的GPT-4o在视觉与听觉上的巨大提高吗?谷歌整了一个类似的AI工具——Project Astra。定位上,Project Astra和GPT-4o都是多模态AI项目,用户能够利用手机摄像头和麦克风与现实世界进行交互,例如帮忙眼瞎人士识别路上的风景等。

(图源:Google)

以上说到的,只是本场I/O研发者大会上谷歌颁布众多AI新技术的冰山一角,还有更加多新玩意值得咱们深入探讨。难怪,在这场发布会后,不少媒介暗示认为谷歌像是要用海量新品「围剿」OpenAI,重树谷歌在AI市场的地位。

对轰GPT,谷歌怒发数款AI新品

很显然,Google I/O 2024最大主角便是「AI」,从硬件到软件,从服务到功能,几乎任何一部分离得了AI这个关键词。据不完全统计,这场发布会上,谷歌最少提了121次「AI」。

既然聊到AI大模型,那还是先瞧瞧Gemini又有了那些新变化。

Gemini Pro从前代的100万Tokens升级到了200万Tokens,与月之暗面的Kimi Chat长度相近,但这个模式并非面向所有用户开放,需要单独申请。Gemini 1.5推出了Flash版本,支持100万Tokens,主打一个便宜量大,1M Tokens输入仅0.35美元、1M Tokens输出仅需0.53美元。

(图源:Google)

另一,谷歌还宣布Gemini Nano进入手机端,日前它能实现的功能是帮忙用户接打tel、识别tel诈骗和骚扰电话。实话说,Gemini Nano的手机端实用性还是略显寒酸,乃至连文字处理都不支持,还不如小爱朋友来得简单粗暴。

假如你对Gemini Nano的功能表现不太满意,能试试谷歌即将推出的Gemini手机客户端,它与前天发布的GPT-4o同样,都是AI多模态应用,能听、会读,还能供给心情价值。只是从演示视频来看,Gemini还不是太「拟人化」。

Gemma2在这场发布会上正式登场,做为谷歌下一代开源模型,它升级到了27B规模,和Meta的Llama 3相近,但体积更小些。值得重视的是,Gemma2能够在NVIDIA的GPU或Vertex AI的单个TPU主机上有效运行。Gemma还迎来了一位新成员:PaliGemma,这是一个开源的图像输入模型。

除了Gemini和Gemma的升级之外,基于大模型技术,谷歌还推出了三款全新的AI大模型应用:Imagen 3、Music AI Sandbox、Veo。

(图源:Google)

Imagen 3是谷歌最新的画图模型,你能够理解为谷歌版本的stable diffusion,即文生图模型。根据谷歌的说法,Imagen 3相比起前代,在生成速度、生成质量和理解能力上均有很强提高

Music AI Sandbox是一款音乐创作大模型,和之前火遍全网的suno差不多,而它的优良在于创作完成后能够一键上传至Youtube,这何尝不是一种生态优良呢?至于Veo,这是谷歌首款文生视频模型,对标GPT的Sora,但它时长支持到最高1分钟、分辨率支持到1080P,还支持更加多滤镜和电影风格,无论是哪一方面,看起来都比Sora可靠得多。

不难看出,谷歌日前在AI行业的战略还是相对稳健,例如模型性能升级,仅从100万Tokens提高到200万Tokens,和早前公众的预期有些差距;而新的AI大模型应用部分,无论是新升级的文生图模型,还是全新的音乐创作模型、文生视频模型,都是「守擂」型制品,少了些创意和想象力。但谷歌天然的优良在于生态,这才是其与OpenAI叫板的底气。

AI加入谷歌整家

做为当前的互联网巨头之一,谷歌的软件生态、服务生态自然是相当全面的,例如谷歌持有当前最大用户数量的浏览器Chrome,持有最完善的Google办公套件,以及日前最大的移动操作系统生态。现如今,谷歌正式将AI引入到「谷歌整家桶」中,彻底梭哈AI。

首要谷歌发布了全新侧栏应用Side Panel,这是一项综合了谷歌旗下服务的「侧边栏」,当你在Gmail中收到重要信息时,能够直接在Side Panel中呼出谷歌云盘存储信息,又或是起步Google Map进行导航,还能够运用谷歌日历记录日程等。在谷歌的计划中,Gmail火速持有自动处理重要信息的能力。

Gmail还加入了智能对话的特性,简单来讲此刻你能够以对话的方式在邮箱中找到所需要的信息及关联邮件,还能让Gemini帮你总结这些邮件说了什么,乃至能够让它帮你智能回复对方,并保持邮件所需的正式用语和语气。

(图源:Google)

其次,前面说到了Gemini将推出手机客户端,除了能够和用户进行普通的对话、文案总结、文字生成等,Gemini还持有Gemini Live功能,即经过摄像头和你直接对话。

最后,是最重磅的——AI Overviews。做为搜索引擎巨头,谷歌要怎样将大模型融入到搜索上,这始终咱们所好奇的,就在这场发布会上,谷歌最终推出了首款AI搜索大模型AI Overviews。

与Perplexity或Arc Search相比,AI Overviews的优良在于综合搜索能力有了长足的进步,且得益于Gemini的推理能力提高,其得到的搜索结果会更符合用户的需要。AI Overviews还支持Plan Ahead,即「为你计划」,尽管AI搜索只能帮用户做搜索结果的总结,但基于推理能力和决策能力的升级,Plan Ahead能够为用户生成各样计划,例如膳食计划、健身计划、旅行计划等。

(图源:Google)

AI Overviews不仅支持文字搜索,还能经过语音和照片进行搜索,例如当你遇到不认识的植物,那样仅需拍摄、上传,就能让谷歌帮你找出这种植物的关联资料。而这项功能会与Pixel上的「划圈即搜」功能相结合,在将来几个月内上线。

能够说,AI已然作为谷歌几乎所有业务的核心,除了咱们熟练的大模型应用之外,还在办公、娱乐行业供给基于Gemini大模型的AI功能,并互相之间有所串联,提高综合工作的效率。

One More Thing:奥秘AI眼镜揭发

在演示Project Astra的过程中,除了像OpenAI同样运用iPhone进行功能展示,还运用了一款智能眼镜。但与咱们之前见到的Google Project Galass区别,这可能是一款全新的智能眼镜制品

(图源:Google)

初代Google Project Galass诞生于2012年,在那个智能手机还不算普及的年代里,谷歌就将智能穿戴设备打导致平民化的消费级制品。但事实上,Google Project Galass受限于制品形态和制品性能,以及相对昂贵的售价,始终都不受市场的欢迎,而谷歌在前几年宣告这个项目被取消。

Project Astra可能是最适合Google Project Galass的AI形态,一方面,它的交互简单,无需太多传感器进行辅助识别;另一方面,它利用大模型的学习、理解、推理能力,能够简单地帮忙用户判断现实世界的物体、景色以及突发事件。

当然,谷歌并真正发布这款制品,但结合Apple Vision Pro重新带动虚拟现实(空间计算)市场的热榜来看,谷歌极有可能抢先于苹果,将AI大模型带入到穿戴设备,以快速抢占AR/VR市场。

眼花缭乱的I/O,谷歌真慌了神?

整场发布会下来,谷歌发布了非常多的AI新品,触及到大模型技术的迭代、新AI应用的落地以及开源模型再一次进化。但长达数小时的发布会加体验环节,谷歌缺少了一款真正道理上的「爆品」来导致市场的高度关注。

例如,谷歌发布了一款对标OpenAI Sora的Veo,无论是输入内容的支持、生成视频时长还是生成视频的清晰度,都能够说是「吊打」Sora的存在,但Sora已然抢先于谷歌,诱发了市场对文生视频应用的讨论,这就引起尽管Veo很牛,可讨论度显著不足。

(图源:Google)

说,谷歌似乎不太懂怎样抓住大众的眼球,这从其频频翻车的演示能看出些端倪。还记得Bard首次显现时回答问题错误的状况吗?是的,在这一次AI Overviews的演示上,又一次给用户错误的意见导致不小的争议。

而谷歌在会上强调了Gemini的「优惠价格」,试图想要以低价与头部企业们竞争。但现实情况是,百度文心一言、阿里通义千问早就开放了长文本阅读、月之暗面的Kimi加入了200万Tokens的免费大战,就连有些晚来的豆包,在今日举行的发布会上公开了超低价的策略。

创意欠缺、低价拼不外,这便是谷歌在I/O研发者大会上给大众的印象。不外,谷歌最重要的杀手锏仍然是它的AI搜索,而这项功能是不是会让谷歌实现逆风翻盘,或许还要等到AI Overviews正式上线后才可解答。





上一篇:谷歌多形态智能设备有望下月亮相,四款手机确定
下一篇:谷歌新款Nest恒温器持有改进的用户界面和“无边框”暗示屏
回复

使用道具 举报

3045

主题

3万

回帖

9910万

积分

论坛元老

Rank: 8Rank: 8

积分
99109052
发表于 2024-8-26 05:07:01 | 显示全部楼层
楼主的文章非常有意义,提升了我的知识水平。
回复

使用道具 举报

0

主题

1万

回帖

1

积分

新手上路

Rank: 1

积分
1
发表于 2024-9-10 02:35:03 | 显示全部楼层
楼主的文章深得我心,表示由衷的感谢!
回复

使用道具 举报

3072

主题

3万

回帖

9915万

积分

论坛元老

Rank: 8Rank: 8

积分
99158925
发表于 2024-10-16 16:13:27 | 显示全部楼层
外链发布社区 http://www.fok120.com/
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

站点统计|Archiver|手机版|小黑屋|外链论坛 ( 非经营性网站 )|网站地图

GMT+8, 2024-11-23 11:28 , Processed in 0.120673 second(s), 22 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.