本文作者:张逸凡
编辑:申思琦
源自:硬AI
百度,一家在PC时代崭露头角的科技巨头,面临了在移动互联网时代的挑战和竞争,似乎未能完全抓住时代的机遇,相比于其他科技机构在这一周期的快速发展,百度显出有些落后。
随着时间进入人工智能(AI)时代,百度期盼能够借此机会弥补过去在移动互联网时代的失地,重新确立自己在技术行业的领导地位。
在刚才结束的百度最新财报会上,机构透露了AI业务的最新发展:
• AI云服务营收同比增长12%;
• 百度搜索11%内容由AI生成;
• 大模型API调用量激增:近五个月,从5000万增长至2亿;
• AI模型性能大幅优化:训练效率加强到 5.1 倍,推理成本降低到百分之一;
百度董事长兼首席执行官李彦宏在tel会中暗示,机构正在从以互联网为中心转向人工智能优先,推进用文心大模型重构To C和To B业务。日前,文心大模型日均处理Tokens文本约2500亿,日均调用量2亿次。
李彦宏尤其强调:搜索最有可能作为AI时代的“杀手级”应用(killer app),而百度搜索的AI重构工作仍处在初期周期。
另外,百度CFO罗戎叫作,在将来几个季度,百度将继续支持AI业务高质量增长。机构认为,随着中国生成式 AI 的新时代展开,将为百度带来更加多机遇。
1、“All in AI” —— 百度的新机遇?
为了实现李彦宏“以互联网为中心转向人工智能优先”这一目的,百度正大力投资于AI技术的开发和应用,尤其是在自动驾驶、深度学习、自然语言处理等行业。
百度正试图抢回在移动互联网时代失去的阵地。
• PC时代,凭借着独特的搜索引擎技术,百度作为了国内的搜索龙头;
• 移动互联网时代,用户流量从PC端转移到移动端,机构虽多方位布局,但相较于腾讯/阿里仍显逊色;
• 在举荐算法时代,又大幅落后于字节信息去中心化模式;
• 迈入AI时代,百度基于其在AI行业持有的深厚累积,期盼能够这里浪潮中突围;
AI效果在财报中已逐步明显,今年一季度智能云业务的收入达到47亿元,同比增长12%,来自生成式人工智能和基本模型的收入占智能云业务收入的6.9%。
2、AI云服务,从芯片到平台
2016年,百度CEO李彦宏提出“AI+云+大数据”的云服务战略。
此后,百度智能云构建了“芯片—框架—模型—MaaS平台”的全栈式AI基本设备,这一基本设备支持从数据存储到模型训练、安排、运行的全链路AI服务。
值得一提的是,百度飞桨平台已然兼容了50多种区别芯片,许大都是本土设计的,研发者社区已然增长至1300万。
这种AI基本设备布局模式,亦让百度在受制外边环境状况下,更好的匹配国内AI云需求。李彦宏认为,这种模式使得百度能够将不太先进的芯片用于高度有效的模型训练和推理。
李彦宏在tel会中叫作,百度把来自区别供应商的GPU集成到统一的计算集群中,以训练大语言模型,“咱们的平台在GPU集群上展示了非常高的效率,该集群由成百上千的GPU构成,这是在进口GPU受到限制的背景下取得的重要突破。”
1)自主开发芯片
机构自主开发了 AI 芯片(昆仑)和语音交互芯片(鸿鹄),用于优化语音、自然语言处理、图像等 AI 技术,并支持机构的深度学习框架。
芯片最新发展:
• AI芯片:迭代到昆仑2,相比昆仑1代性能提高了2-3倍,供给128TFLOPS算力,内存带宽512GB/s;
• 语音交互芯片:迭代到鸿鹄900,较上一代鸿鹄818芯片,CPU性能提高200%,GPU提高160%,搭载于华为智慧屏V5 Pro;
2)深度学习框架 —— Paddle Paddle
Paddle Paddle是百度基于BERT自研的深度学习框架,集成为了深度学习核心训练和推理框架、基本模型库、端到端研发套件和丰富的工具组件。
该框架服务企业遍布能源、金融、工业、医疗、农业等多个行业。例如,连心医疗基于PaddlePaddle平台研发的“基于CT影像的肺炎筛查与病情预评定AI系统”已在湖南郴州湘南学院附庸医院投入运用。
Paddle Paddle采用了开源的形式,方便百度更好的创立自己的AI生态圈。
按照机构披露的信息:
• 截止 2024 年 4 月中旬,PaddlePaddle 研发者社区已然持有了 1300 万名成员;
• 截止2023年底, PaddlePaddle 为 23.5 万家企业供给服务,研发社区已然创建了 86万个模型;
另外,数据表示,Paddle Paddle 在 Github 运用人数、贡献者人数和技术迭代速度上,仅次于海外一线平台 Pytorch 和 TensorFlow。
3)AI大模型 —— 文心系列模型(Ernie)
基于强大的基本模型(Paddle Paddle),百度开发了文心系列模型Ernie(有趣小故事:文心一言的英文名为“Ernie”, 源于美国儿童节目《芝麻街》中的角色的名字,而节目中Ernie的好伴侣正是Bert,Bert是谷歌2018年发布的AI模型)。
日前迭代至文心 4.0,参数规模可能超1万亿,约为文心 3.5 的4-5倍。
按照机构披露,截迄今年4 月,文心模型每日处理的 API 调用约为 2 亿次,远超去年 12 月的约 5000 万次调用,显示百度文心模型正被越来越多的人所采用,并预示着将来模型推理具备强劲的收入潜能。
另外,为了让模型更具性价比,机构经过独有的四层人工智能架构和强大的端到端优化能力,持续加强模型的效率。与 3 月 23 日的版本相比,文心模型的训练效率加强到 5.1 倍,推理成本降低到百分之一。
4)MaaS(AI研发云平台)
为了让研发者更简单的研发AI模型,百度在云平台上供给了三套工具:
• AppBuilder 和 ModelBuilder:供企业和个人研发者研发应用程序和搭建模型;
• AgentBuilder:能够容易创建一个AI Agent;
盈利方面,百度从 2022 起始将业务重点放在提高 AI 智能云业务的利润率上,拔除了低质量业务,同期致力于为区别行业的客户定制标准化 AI 处理方法。
24Q1的业绩会上,机构暗示,智能云收入增长重点由生成式 AI 和模型训练驱动。日前,大部分收入来自模型训练,但来自模型推理的收入增长火速。
展望将来,百度认为模型推理是最重要的长时间机遇之一,亦是将来人工智能云收入的重点增长动力。
3、“AI+”业务赋能
AI技术在百度内部广泛应用于搜索引擎、信息流举荐、百度翻译等多个行业。在tel会中,李彦宏对将来AI赋能搜索支柱业务自信心更足,认为搜索是AI时代最可能作为杀手级应用的制品:“AI搜索能运用户能够做到以前做不到的事,并且百度暂时还没打算对这部分收费。”
去年第二季度起始,百度就已然运用文心一言重建百度搜索,此刻越来越多的搜索结果是文心一言以区别格式如文本、图像、第三方链接等组合而成的。
在模型构建上,百度运用了3种轻质模型和2种针对特定任务的模型,并且搭配专家混合模型,用来给大模型分配任务,在性能和成本上找到了更好的平衡。
从数据上看,AI确实正在提高百度各个业务的效率:
1)AI+百度搜索:截止24Q1,百度搜索有11%的内容由AI生成,同期,AI搜索推动了宣传收入的增长;
2)AI+百度文库:经过引入生成式AI功能,吸引了18%的新付花费户。这些功能包含内容总结、创作、扩展以及将灵感一键转化为Powerpoint等。24Q1 百度文库付费用户数量实现了两位数的同比增长。
3)AI+百度地图:引入了“AI向导”功能,在理解用户需求的基本上,智能调用众多地图功能及服务,快捷准确地给出处理方法;
4)AI+百度网盘:推出了基于文心大模型的智能助理“云一朵”,帮忙用户实现一句话快速搜索文件和视频、总结知识、翻译文档、乃至进行内容创作的功能。 截至23Q3“云一朵”的用户已达到2000万。
4、终端厂商合作 AI手机/AI PC
AI除了对内提高效率,本季度百度亦进一步扩大了对外合作。
按照机构披露,上季度,机构已与三星中国、荣耀等手机厂商达成合作。本季度,合作扩展到更加多领先智能手机厂商,包含Oppo、VIVO和小米。
业务范围亦从智能手机扩展到PC和电动汽车行业,进一步扩大了百度的AI生态圈。联想正利用Ernie API为其默认浏览器中的AI助手供给支持,蔚来汽车起始运用Ernie API加强车内体验。
另外,机构吸引了许多新客户,包含携程、高途、招聘、作业帮和新加坡旅游局,经过AI技术,帮忙她们重构所有面向消费者的制品,以供给更好的用户体验。
5、对外投资
除了自主开发,百度亦经过对外投资来持续扩展自家的AI生态,覆盖了芯片-模型-模型应用三大环节。但很显著,与阿里区别,百度的对外投资更偏向于上下两端。
这个原由亦不难理解,由于百度将来将依靠搜索这类应用端支撑收入,完成商场模式闭环的。
最有表率性的一个证明来自李彦宏对大模型开源还是闭源的判断:“大模型开源道理不大,闭源才可走通商场模式,是能够赚到钱的,能够赚到钱才可聚集算力、聚集人才。”
“闭源在成本上反而是有优良的,只要是同等能力,闭源模型的推理成本必定是更低的,响应速度必定更快”,这亦是与阿里云区别的商场模式的思考。
因此,根据百度的思路,将来的路已然比较清晰,但AI时代的竞争显然会比PC时代更加激烈。
本文来自华尔街见闻,欢迎下载APP查看更加多
|