文 | 周鑫雨
编辑 | 邓咏仪
“GPT-3.5(ChatGPT) API将在某个时刻退役——只是不确定在何时。”在The Verge的采访中,OpenAI API平台负责人Olivier Godement如此总结。
而如今,ChatGPT的缔造者——OpenAI,率先“终结”了好大儿ChatGPT。
太平洋时间2024年7月18日,OpenAI推出了新款模型GPT-4o mini。这款新模型,是被业界叫作作“做接近《Her》”的多模态模型GPT-4o的“子弹版”:尺寸更小、价格更低,但性能强劲。OpenAI在官宣中将其叫作为:
OpenAI最具性价比的轻量级模型。
OpenAI X。
OpenAI创始人兼CEO Sam Altman激动得刚开场就大开香槟:
咱们认为,人们会非常、非常爱好运用新模型。
Sam Altman X。
日前,ChatGPT的非企业用户(包含未订阅者、ChatGPT Plus和团队版本订阅者)即日起就能尝鲜到这款新模型,而GPT-4o mini在下周亦将对ChatGPT企业用户开放。
OpenAI预告,在将来几天内,支持GPT-4o mini微调的API版本亦将推出。
比GPT-3.5便宜60%,比GPT-4更会聊天
在信奉“大”的Scaling Law(规模定律)作为模型训练第1性原理的当下,贵,始终是大模型落地的痛点:API贵,运用过程中产生的推理成本更贵。
能让Altman连吹“彩虹屁”,GPT-4o mini最关键的卖点,便是将奢侈品做到了地摊货的价格:
输入:15美分/百万Tokens;输出:60美分/百万Tokens。
相对地,打响OpenAI内部模型价格战的GPT-3.5 Turbo,价格为:
输入:50美分/百万Tokens;输出:150美分/百万Tokens。
这寓意着,GPT-4o mini,比上一代的GPT-3.5 Turbo便宜了60%多。
在性能的硬指标上,GPT-4o mini在文本理解和多模态推理维度的学术基准测试中,已然超越了GPT-3.5 Turbo和主流的轻量模型,且支持GPT-4o同等多的语种。
GPT-4o mini的性能测评结果。图源:OoenAI
与此同期,GPT-4o mini(上下文窗口为128K)不仅在长文本处理性能上优于GPT-3.5 Turbo(上下文窗口为16K),亦有出色的函数调用能力,这寓意着研发者能够基于这个底座,构建性能更优异的AI Agent应用。
据OpenAI介绍,在与金融科技机构Ramp的合作测试过程中,基于GPT-4o mini研发的收据花费数据提取应用,无需文本数据,只按照上传的收据照片,就能为用户进行收据归类。
视听,始终被认为是比文本和图像更有可能颠覆现有人机交互方式的两种模态。
脱胎于能够实时处理音频、视频和文本的GPT-4o,多模态理解能力亦成为了GPT-4o mini的杀手锏。在大模型测评公司 LMSYS的聊天设备人竞技场排行榜中,GPT-4o mini的排名超过了GPT-4。
日前,GPT-4o mini供给的API服务,支持文本和视觉两种模态的处理,在将来,其支持的模态还将扩展到图像和音频。
通往AGI的奥义是,AI要更便宜
自2023年下半年起,“落地”就成为了AI圈内最常提及的专题。
一个显著的趋势是,为了加快AI的落地,模型尺寸在变小,更轻量、更垂的模型持续推出,模型变得越来亦便宜——
OpenAI于2024年1月推出GPT-3.5 Turbo,就将Tokens输入价格降低了50%,输出价格降低了25%;后续的GPT-4o,亦号叫作速度加强2倍,但价格减半。
“咱们认为,经过让智能变得更加实惠,GPT-4o mini将明显扩大运用AI构建的应用程序的范围。”OpenAI指出,“自性能较弱的模型 text-davinci-003 在2022年发布败兴,GPT-4o mini每Token的处理成本已然下降了99%。 ”
让广阔的C端用户“人人都用得起AI”,是OpenAI从2023年营收中学到的一课。
ChatGPT Plus 每月20美元的订阅费,对大都数人而言还是不足便宜。据调研公司FutureSearch,ChatGPT Plus截止2024年6月的订阅收入(约19亿美元),占到了2024年预计年化营收(约34亿美元)的55%;而企业用户和API服务的营收,分别只占到了21%和15%。
图源:FutureSearch
终极目的要做AGI(通用人工智能)的OpenAI,最终起始“卷”小模型,亦是为近期的行业定下重要基调。
无独有偶,“欧洲版OpenAI”Mistral AI、近期有名的“AI鲶鱼”Deepseek,亦在同一天发布了模型的新发展,前者已然作为小模型的强劲标杆,而后者则是最近打响打模型价格战的奥秘选手。
从2023年起始,在通用模型层,大众要否则便是推出性能更好、价格更低的开源模型,或是把模型蒸馏、压缩,尺寸做得更小——便是意在扩大研发者群体,让更加多人能先用起来。从2024年5月起始的国内大模型价格战,大众纷纷把价格降到最低,道理亦是一样。
在开源和闭源两条道路上,领军者们都达成为了一致。
在商场化落地上,2024“端侧”大战的战火已然燃起。AI手机就已然打得激烈——无论是年初的三星S24系列,还是9月即将要出来的iPhone 16,国内的华米OV,都把AI做为今年最重要的卖点。
除此之外,还有PC、家电,各行各业的硬件制品,都等着用大模型来把自己“再做一遍”。做出体量更小、性能更强,能跑在各个终端的大模型,亦是大势所趋。
欢迎交流!返回外链论坛:www.fok120.com,查看更加多
责任编辑:网友投稿
|