对标OpenAI 谷歌推出最强大 AI 模型 Gemini 1.5 Pro

219mze · 发表于 2024-7-30 19:42:26

驱动中国5月15日信息 2024年I/O研发者大会上于美国东部时间2024年5月14日13时（北京时间5月15日1时）在加利福尼亚州山景城的海岸线露天剧场隆重开幕。这里活动中，Alphabet向全世界展示了机构最新开发的最小且最有效的人工智能模型。

在周二的大会中，Alphabet推出了Gemini系列人工智能模型的新成员——Gemini 1.5 Flash。这一新模型以其更快的速度、更小的体积和更灵活的安排能力而受到关注，同期它还具备多模态的支持能力。谷歌DeepMind的联合创始人兼首席执行官戴密斯·哈萨比斯暗示：“咱们听到研发人员的需要，她们期望运用反应更快、成本更低的模型。”与功能更强大的版本同样，Gemini 1.5 Flash能处理海量数据，并在聊天应用、视频和图像字幕方面进行了优化。

随着Alphabet 2024年I/O研发者大会的召开，越来越多的科技机构起始将制品研发和推广的重点转向生成式人工智能行业。这对Alphabet旗下的谷歌机构来讲尤为重要，由于与传统的在线搜索相比，新工具为消费者供给了更先进、更具创意的在线信息获取方式。与此同期，OpenAI亦在周一推出了新的人工智能模型GPT-4o和桌面版ChatGPT，以及新的用户界面。该机构声叫作，GPT-4o的反应速度是GPT-4 Turbo的两倍，但成本仅有后者的一半。

Alphabet还宣布了对能够处理海量数据的Gemini 1.5 Pro模型的升级，将上下文窗口（即人工智能模型可理解的信息量）从当前的100万tokens增多到200万。这寓意着当在一个提示中给出数千页的文本或一个多小时的视频时，Gemini 1.5 Pro能够回答用户的问题。

据负责Gemini项目的谷歌副总裁透露，Gemini 1.5 Pro模型一次性能够理解长达1500页的多个大型文件，或是对100封电子邮件进行总结。另外，Gemini 1.5 Pro将火速能够处理时长为一小时的视频内容，或超过3万行的代码库。他暗示：“面对海量的文件，用户能够火速获取到核心内容，例如弄清楚租赁协议中宠物政策的细节，或对多篇长篇科研论文的关键论点进行比较。”

OpenAI本周宣布的最新升级，为50种区别语言的ChatGPT带来了更高的质量和响应速度。该机构还暗示，将经过OpenAI的应用编程接口（API）供给，准许研发人员立即起始运用新模型构建应用。

Alphabet暗示，Gemini 1.5 Pro支持35种语言，并持有达到200万个tokens的上下文窗口。机构高管暗示，新模型加强了局部推理、规划和图像理解能力。Alphabet首席执行官桑德尔·皮查伊叫作：“Gemini 1.5 Pro供给了迄今为止所有基本模型中最长的上下文窗口。”

Alphabet还暗示，Gemini 1.5 Pro首要将在内测实验室Workspace Labs进行测试；而Gemini 1.5 Flash将用于测试和在设备学习平台Vertex AI中运用，该平台准许研发人员训练和安排人工智能应用。返回外链论坛：www.fok120.com，查看更加多

责任编辑：网友投稿

b1gc8v · 发表于 2024-8-21 18:44:59

在遇到你之前，我对人世间是否有真正的圣人是怀疑的。

流星的美 · 发表于 2024-8-23 09:10:17

外链发布论坛学习网络优化SEO。

听听海 · 发表于 2024-9-8 04:15:57

你的留言真是温暖如春，让我感受到了无尽的支持与鼓励。

j8typz · 发表于 2024-10-15 16:28:59

论坛外链网 http://www.fok120.com/

		自动登录	找回密码
密码			立即注册