4zhvml8 发表于 2024-7-30 19:38:01

全面叫板OpenAI!谷歌发布多模态大模型整家桶:从AI助手到文生视频模型


    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">被OpenAI抢先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)<span style="color: black;">制品</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">当地时间5月14日,在谷歌I/O<span style="color: black;">研发</span>者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,以及在硬件方面发布的第六代Tensor处理器单元(TPU)Trillium芯片。<span style="color: black;">按照</span>发布会最后的官方统计,完全聚焦于AI的这场主题演讲总共<span style="color: black;">说到</span>了121次AI。</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-axegupay5k/16d03411cb224aa7bc5856eef5782eee~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1722921943&amp;x-signature=DR40VHYsybRRM1R01dE0o6XEpu8%3D" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">完全聚焦于AI的这场主题演讲总共<span style="color: black;">说到</span>了121次AI。 <span style="color: black;">源自</span>:谷歌I/O主题演讲</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">谷歌CEO桑达尔·皮查伊(Sundar Pichai)<span style="color: black;">暗示</span>,谷歌的所有工作都在围绕生成式AI模型Gemini展开,“<span style="color: black;">咱们</span><span style="color: black;">期盼</span><span style="color: black;">每一个</span>人都能从Gemini所做的事情中受益”。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">14日当天,谷歌(Nasdaq:GOOGL)股价收于每股171.93美元,涨0.6%,总市值2.12万亿美元。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">AI搜索支持视频输入,Gemini、Gemma上新</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">做为</span>搜索引擎巨头,AI搜索正是谷歌所做工作中的一部分。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">据介绍,在最新Gemini的加持下,谷歌搜索将具备多<span style="color: black;">过程</span>推理能力,<span style="color: black;">能够</span>一次性处理带有多个限制<span style="color: black;">要求</span>的长问题、<span style="color: black;">帮忙</span>用户进行头脑风暴,并支持视频搜索,让用户<span style="color: black;">经过</span>拍摄视频来搜索<span style="color: black;">处理</span><span style="color: black;">方法</span>。这些功能将先在美国推出,谷歌预计会在今年年底前将其带给超过10亿人。</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/54852206dd4af75cc772197b22e775ba~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1722921943&amp;x-signature=KUmnfr%2BY%2FdFoSGIrtW%2FgtryJFpg%3D" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">谷歌AI搜索将具备多<span style="color: black;">过程</span>推理能力。<span style="color: black;">源自</span>:谷歌</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">谷歌的Gemini以超长的上下文窗口而出名。在大会上,谷歌重点强调了大模型Gemini 1.5 Pro的多模态和长文本能力,为其推出一系列更新。谷歌将向<span style="color: black;">全世界</span>150多个国家地区的Gemini Advanced订阅者<span style="color: black;">供给</span>最新模型、<span style="color: black;">持有</span>100万个token的Gemini 1.5 Pro,支持超过35种语言,定价为每100万token 3.5美元。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">据皮查伊介绍,Gemini 1.5会<span style="color: black;">供给</span>“迄今为止所有<span style="color: black;">基本</span>模型中最长的上下文窗口”。Gemini 1.5 Pro将在今年晚些时候将会把窗口进一步扩大至200万token,拓展同步处理多模态信息的边界。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">从今年夏天<span style="color: black;">起始</span>,Gemini将支持语音实时交互,并在今年晚些时候上线实时视频交互。<span style="color: black;">将来</span>几个月内,谷歌<span style="color: black;">亦</span>将推出类似于GPTs的自定义AI助手功能,名为Gems,<span style="color: black;">能够</span>与整套“谷歌<span style="color: black;">整家</span>桶”联动。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">另一</span>,<span style="color: black;">针对</span><span style="color: black;">有些</span>需要快速响应的场景,谷歌推出了Gemini 1.5 Flash模型。Flash将是API中速度最快的Gemini模型,针对大规模、大批量的高配任务进行了优化,<span style="color: black;">亦</span><span style="color: black;">拥有</span>100万token的长上下文窗口。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">谷歌<span style="color: black;">亦</span>在发布会上带来了旗下开源大模型Gemma的最新版本Gemma 2。据介绍,Gemma 2采用全新架构,参数上达到27B,<span style="color: black;">持有</span>突破性的性能和效率。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">AI助手Project Astra叫板GPT-4o</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在OpenAI推出能够实现人类级别响应的智能助手GPT-4o后,谷歌的AI智能体项目Project Astra<span style="color: black;">亦</span>重磅登场。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在演示视频中,Astra能够<span style="color: black;">经过</span>手机摄像头或智能眼镜看到的内容来分析响应语音命令。它成功地识别出代码序列、为电路图提出改进<span style="color: black;">意见</span>、能够<span style="color: black;">经过</span>镜头“看到”伦敦国王十字区,并提醒用户智能眼镜的<span style="color: black;">安置</span>位置。</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/de5b95a266babd59aeb566a264ad117d~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1722921943&amp;x-signature=uTPDNj1DLpES6pJ1gEIcopDHv%2FQ%3D" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Project Astra是谷歌<span style="color: black;">针对</span><span style="color: black;">将来</span>AI助手的展望。<span style="color: black;">源自</span>:谷歌</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/40bfa56af8883ee0544307d4b67b21c9~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1722921943&amp;x-signature=N5cDdQH9GGBjCrSKTfyZsMXMNc8%3D" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">谷歌AI助手将能够<span style="color: black;">经过</span>智能眼镜和用户<span style="color: black;">一块</span>观察世界。<span style="color: black;">源自</span>:谷歌</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">据介绍,谷歌在Gemini的<span style="color: black;">基本</span>上<span style="color: black;">研发</span>了Astra的原型,<span style="color: black;">能够</span><span style="color: black;">经过</span>连续编码视频帧、将视频和语音输入组合到事件时间线中以实现更快地处理信息。<span style="color: black;">经过</span>语音模型,谷歌<span style="color: black;">亦</span>强化了智能助手的说话能力,让其能够给出更快速的<span style="color: black;">回复</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">不外</span>,在演示视频中,<strong style="color: blue;">谷歌AI助手的<span style="color: black;">回复</span>速度似乎还是会比GPT-4o稍慢<span style="color: black;">有些</span>,语音所表现出的感情色彩<span style="color: black;">亦</span>平淡<span style="color: black;">有些</span>。</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">皮查伊<span style="color: black;">暗示</span>,谷歌计划从今年<span style="color: black;">起始</span>将Astra的功能添加到其Gemini应用程序及其<span style="color: black;">制品</span>中。<span style="color: black;">不外</span>,他<span style="color: black;">亦</span>强调,虽然<span style="color: black;">最后</span><span style="color: black;">目的</span>是“让Astra在<span style="color: black;">机构</span>的软件中实现无缝连接”,但该<span style="color: black;">制品</span>将被<span style="color: black;">小心</span>推出,并且“<span style="color: black;">商场</span>化之路将由质量驱动”。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">除了在AI助手<span style="color: black;">行业</span>的竞争外,谷歌还<span style="color: black;">经过</span>文生视频模型Veo来反击OpenAI的Sora。Veo能够<span style="color: black;">按照</span>文字、<span style="color: black;">照片</span>和视频的提示来生成高质量的1080p视频,创作“一致且连贯”的镜头,用户<span style="color: black;">能够</span>对光照、镜头语言、视频颜色风格等进行自定义设置。<span style="color: black;">不外</span>,谷歌<span style="color: black;">无</span>宣布Veo的<span style="color: black;">详细</span>推出时间。</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/e0cbb9fc1bd5f50783467c94f95f3ccc~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1722921943&amp;x-signature=Za40z%2F1E8FzNBgani4LMVjAA%2FVM%3D" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">源自</span>:谷歌I/O主题演讲</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">另外</span>,谷歌还宣布了一系列与图像、音乐<span style="color: black;">相关</span>的生成式AI工具,<span style="color: black;">包含</span>能够表现更高细节水平的文生图工具Imagen 3,还有与Youtube以及音乐家合作的AI音乐工具“AI音乐沙盒”。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在硬件方面,谷歌将于今年晚些时候推出交付第六代数据中心AI芯片TPU Trillium。皮查伊<span style="color: black;">暗示</span>,每块芯片的计算性能将比第五代<span style="color: black;">提高</span>4.7倍,谷歌<span style="color: black;">经过</span>扩大芯片的矩阵乘法单元(MXU)和<span style="color: black;">加强</span>整体时钟速度来实现这一<span style="color: black;">目的</span>。<span style="color: black;">另外</span>,第六代将比第五代芯片节能67%,谷歌还将Trillium芯片的内存带宽<span style="color: black;">加强</span>了一倍。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">发布会后,著名AI学者吴恩达(Andrew Ng)对谷歌<span style="color: black;">暗示</span>祝贺,<span style="color: black;">叫作</span>个人很期待“<span style="color: black;">持有</span>200万个token的上下文窗口以及对设备上AI进行更好支持的Gemini”,认为其会为应用程序构建者带来新的机会。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">英伟达高级<span style="color: black;">科研</span><span style="color: black;">专家</span>范麟熙(Jim Fan)<span style="color: black;">暗示</span>:“谷歌正在做的一件事是正确的:<span style="color: black;">她们</span><span style="color: black;">最终</span>在认真将AI整合到搜索中......谷歌最强大的护城河是分销。Gemini不<span style="color: black;">必定</span>要<span style="color: black;">作为</span>最好的模型,而是<span style="color: black;">能够</span><span style="color: black;">作为</span>世界上最常用的模型。”</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">此前,在5月9日播出的一档节目中,谷歌CEO桑达尔·皮查伊接受采访时谈及<span style="color: black;">机构</span>与微软和OpenAI的竞争。他<span style="color: black;">暗示</span>,尽管谷歌在聊天<span style="color: black;">设备</span>人<span style="color: black;">行业</span>的起步较晚,但他对<span style="color: black;">机构</span>的<span style="color: black;">长时间</span>竞争力并不担忧,AI浪潮尚处<span style="color: black;">初期</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">4月25日,谷歌母<span style="color: black;">机构</span>Alphabet发布了<span style="color: black;">截止</span>3月31日的2024年<span style="color: black;">第1</span>季度财报。财报<span style="color: black;">表示</span>,Alphabet<span style="color: black;">第1</span>季度实现营收805.39亿美元,同比增长15%,是自2022年初<span style="color: black;">败兴</span><span style="color: black;">机构</span>营收增长最快的一个季度。非美国通用会计准则下(Non-GAAP)净利润为236.62亿美元,同比增长57%;摊薄后每股收益为1.89美元,高于市场预期的1.51美元。</p>




流星的美 发表于 2024-8-24 18:10:16

在遇到你之前,我对人世间是否有真正的圣人是怀疑的。

明月几时有 发表于 2024-9-9 14:18:23

这夸赞甜到心里,让我感觉温暖无比。

nykek5i 发表于 2024-11-5 07:21:51

论坛外链网http://www.fok120.com/

j8typz 发表于 2024-11-9 12:20:31

我完全赞同你的观点,思考很有深度。

nykek5i 发表于 2024-11-14 00:26:06

楼主的文章非常有意义,提升了我的知识水平。

nykek5i 发表于 2024-11-16 10:14:52

外贸论坛是我们的,责任是我们的,荣誉是我们的,成就是我们的,辉煌是我们的。

7wu1wm0 发表于 前天 20:08

大势所趋,用于讽刺一些制作目的就是为了跟风玩梗,博取眼球的作品。
页: [1]
查看完整版本: 全面叫板OpenAI!谷歌发布多模态大模型整家桶:从AI助手到文生视频模型