导语:中国那些机构在砸真金白银搞AI?
文 | 胡安
今年2月中旬,OpenAI发布了人工智能文生视频大模型Sora。从2月中旬到此刻,能够说是人工智能行业动态发布最密集的一个时期:英伟达跃升全世界市值第三大科技机构并在GTC大会上发布了令人瞩目的突破性成果,Groq、Cerebras发布了最新的AI芯片,谷歌、苹果等大厂和Anthropic、Mistral、Inflection等独角兽亦在这个时间内发布了最新的大模型。
照片源自:NVIDIA GTC 2024 主题演讲,NVIDIA官网
无论是从AI芯片、AI“三算”,还是从AI模型看,似乎美国的这些发展都让人不得不感慨它相较于中国在人工智能行业的先发优势。AI产业链中游重点包含基于各类识别技术构建的软件制品、处理方法和技术平台,是产业链中创新价值、产业价值最高的环节,而其中的大模型板块,是最受公众关注和中美AI行业竞争的焦点。
2023年9月,钛媒介国际智库发布了产生必定行业影响力的《2023 AI大模型应用中美比较科研》报告。报告指出,中美在AI大模型方向领先其他各国,双方竞争在各方面各有优良,美国科技巨头长时间投身基本理论科研,使美国得以引领全世界人工智能发展,在基本大模型上能够保持领先优良。同期,大额投资亦为美国开发工作供给了有力支撑。而中国因为人才、资本和技术的制约,更倾向于利用龙头企业的开源模型来做应用落地的创业。
不外,虽然国内大模型一直装扮着追随者的角色,但在基本模型方面,中美之间的差距并不大,国内“重应用轻基本”的开发理念以及庞大的下游需要,让国内公司更加专注于落地应用的科研,能够说在AI大模型应用方面更胜一筹。
当前,国内开发基本大模型的企业较少,仅有百度、华为、腾讯、阿里等,同期,有许多企业依托在各自动业的深耕,或外接基本模型,或利用开源模型自研模型,来开发应用于所处行业的AI大模型。
据不完全统计,国内已发布大模型近190个,涵盖盘古、悟道、文心一言、通义千问、星火认知等一批拥有行业影响力的预训练大模型,亦包含“轩辕”金融大模型、“知海图AI”中文大模型、“言犀”产业大模型、WorkMagic Copilot、WPS AI等应用于垂直行业的行业大模型。
科技竞争最后比拼的是人才密度和行业累积,咱们试着从AI大模型关联的比较明显的概念股入手,由开发数据管窥国内关联上市企业的竞争优良。日前,国内AI大模型上市机构生态包括百度生态、腾讯生态、华为生态、阿里生态、小米生态等,同期有三六零、昆仑万维等自研大模型机构。
总的来讲,开发投入的巨大差异,不仅表现在基本大模型开发机构与垂直行业的应用层开发机构之间,亦表现在应用层开发机构所属的区别行业和主营业务之间。例如,聚焦数字阅读和出版的中文在线、垂直于数字营销的浙文互联、更注重法院诉讼服务的金桥信息等,显著开发投入远少于绝大都数AI大模型应用层开发机构。
注:按照能够找到的最新数据,上表中百度、腾讯、华为、小米为2023年数据,阿里巴巴为2023财年数据,字节跳动为2022年数据。澜舟科技未上市,未能找到关联数据。
注:按照能够找到的最新数据,上表中百度、华为、小米为2023年数据,腾讯为2022年数据,阿里巴巴为2021年数据,字节跳动未披露关联数据。澜舟科技未上市,未能找到关联数据。 部分AI大模型应用层开发机构开发花费及人员数据(按照最新披露数据)
01
百度生态
据财报数据,2023年全年,百度开发投入高达242亿元,同比增多4%,占全年营收比例约18%,重点因为支持生成式AI开发投入开支增多。百度在过去十年中,累计开发投入超过1000亿元,开发强度始终位置于中国大型科技互联网机构前列。然而,因为百度这几年进行的本地生活、电商、游戏等业务探索的结果并不尽如人意,员工数量亦在持续变化中,开发人员数量自2021年的27500人下降至2023年的21800人,减少了5700人。
百度对竞争趋势的判断是,短期的竞争围绕基本大模型展开,长时间的竞争则会围绕AI原生应用展开。因此,百度在开发自有大模型的同期,作为了推动大模型加速进入应用侧速度最快的厂商之一。
百度直接持股【每日互动】【汉得信息】【中文在线】等机构,这些机构在百度文心一言大模型的基本上,开发了自己的AI大模型或AI制品。
1. 每日互动
每日互动是国内专业的数据智能服务商,2023年年底发布了机构在品牌营销行业的大模型应用创新成果——AITA智选人群工具。该制品将大模型的强大能力和机构的数智能力深度融合,实现了用AI定向TA(AI-Targeting Audience),能够经过简单的自然语言对话,快速为品牌宣传主生成符合需要的目的投放人群。
每日互动(个推)总部
据2023年三季度数据,每日互动开发投入1.1亿元,占营收的35.48%;2021年每日互动开发人员数量为459人,占员工人数的60.08%。
2. 中文在线
中文在线是中国数字出版的开创者之一,亦是全世界最大的中文数字出版公司之一。2023年10月,中文在线发布了AI大模型“中文逍遥”,首席技术官吴疆将它的技术优良总结为“三个一”:一键生成万字小说,一张照片写一部小说,和一次读懂一百万字小说。
2023年前三季度,中文在线的开发花费为6764万元,同比下降32%,占营收的6.67%。中文在线解释为合并范围变更导致。截止2022年底,中文在线共有开发人员189名,占员工人数的29.1%。
3. 汉得信息
汉得信息是业务流程管理软件供应商,打造了“汉得AIGC中台”,致力于帮忙企业快速落地AI,供给多模型对接能力,内置智能对话应用、可自配置的多归类智能知识问答应用等,帮忙企业有效自定义实现各样业务流程+AI能力。
虽然无推出大模型,但在开发上,汉得信息的投入比很强,2023年三季度报告披露的开发花费达2.04亿元,占营收的9.06%;据2019年的数据,汉得开发人员数量为7918人,占员工人数的82.74%。
02
腾讯生态
2023年9月,腾讯自研的混元大模型发布,经过腾讯云的API向国内企业正式开放。腾讯大模型支持广泛功能,包含照片生成、文案创作、文字辨识以及客户服务等。2023年6月,腾讯推出的模型即服务(MaaS)让企业能够训练自己独有的大模型,而混元让企业有能力打造出功能强大的工具。
自2018年至2023年六年时期,腾讯的累计开发投入超过了2696.54亿元人民币,2023年全年开发投入达到640.78亿元;2022年(无2023年数据),腾讯员工超10万人,而开发人员占比达到了74%,这寓意着平均每四个腾讯员工中,就有三个人从事开发工作。
腾讯概念股包含浙文互联、博思软件、泛微网络、常山北明、长亮科技等。
1. 浙文互联
浙文互联主营业务为数字营销,形成为了以汽车宣传和效果营销业务为主、积极拓展其他利润增长点的业务格局。在创新业务方面,浙文互联搭建了照片及场景等多模态的AIGC数字工具矩阵,完成为了虚拟人、虚拟空间、虚拟物等元宇宙创新业务基建,推出AIGC绘画工具“米画”、元宇宙场景生成工具“数字战士”等工具应用。
2022年,浙文互联开发投入为5402万元;2023年前三季度开发投入2604万元,同比增长5.17%。至2022年底,开发人员191人,占员工总数的16.3%。
2. 博思软件
博思软件聚焦数字票证、智慧财政财务、数字采购三大行业,供给财政信息化管理及互联网关联软件制品及服务。
按照3月4日投资者平台官方回复,博思软件已然将AI赋能于AI+财税服务、AI+非税票据、AI+商保、AI+采购、AI+绩效,创新应用“数据+算法+AI”打造的“采购设备人”在国内人工智能价格监测行业处在行业领先。
2023年前三季度,博思软件开发花费为3.1亿元,同比增长42.41%,占营收的28.16%。截止2022年,员工总数逾6000人,其中70%以上为开发技术人员。
3. 泛微网络
泛微网络专注于协同管理软件行业,为客户供给数字化场景应用软件,如人事管理、知识管理和营销管理等。
泛微网络推出了智能小e中间件平台,利用泛微的千里聆模型与大语言模型分工合作,重点有AI问答、AI办公、AI工具等功能。去年10月,泛微网络还发布了e-builder低代码平台,客户能够经过拖拉拽组合,像积木同样搭建应用。
泛微制品生态体系2023年,泛微网络开发投入3.54亿元,同比增长4.23%,占营收的14.8%。机构的开发人员由2017年的387人增长至2022年的1075人,占员工总数比例由40.27%增长至55.38%,但2023年开发人员数量下降,剩余880人,占员工总数的52.63%。4. 常山北明常山北明是智慧城市、安全城市的处理方法及运营服务供给商。腾讯持有常山北明全资子机构北明软件的股份,同期,北明软件与腾讯云签署了框架合作协议书,在云计算、大数据、人工智能等行业开展制品与技术的全方位合作,一起推动在线矛盾纠纷多元化解平台运营。北明软件还是华为鲲鹏生态的深度参与者及鲲鹏计算产业首批认证伙伴之一。常山北明2023年前三季度开发投入为1.3亿元,同比减少3.69%,占营收的2.8%。2022年开发人员为2117人,同比减少12.41%,占员工总数的46.29%。5. 长亮科技长亮科技专注金融科技行业,供给咨询、金融科技制品、金融IT服务,以及覆盖数字金融、智慧金融、智慧财务等业务的全栈领先处理方法。截止23年三季度,腾讯为长亮科技第二大股东,占流通股比2.29%。机构在核心系统上云方面与华为云、阿里云、腾讯云等均有合作,并已然在触及金融科技行业的人工智能行业成立了关联的科研公司,开展了部分制品的开发与基本应用工作,如智能客服。
2023年前三季度,长亮科技在业绩承压之下仍旧加强了针对开发投入力度,报告期内机构的开发花费为1.1亿元,占营收的9.34%。但从历年数据上来看,2020年至2022年,长亮科技开发投入金额逐年下滑,分别为17984.17万元、14801.47万元和14779.74万元,在营业收入中的占比从11.60%下滑至7.83%。2022年,长亮科技的开发人员数量显现大幅变动,由2021年的977人下降至772人,变动比例达-20.98%,占员工总数的11.22%。长亮科技回复投资人叫作,其中,重点是学历为本科、30岁以下的开发人员减少的幅度很强。
03
华为生态
华为长时间致力于人工智能核心技术的开发,去年推出了盘古大模型3.0,保持“AI for Industries”理念,将人工智能技术深度融合至各个行业。做为中国首个全栈自主、安全靠谱的AI大模型,盘古大模型包含 “5+N+X”三层架构,采用完全的分层解耦设计,企业用户能够基于自己的业务需要选取适合的大模型研发、升级或精调,从而适配千行万业多变的需要。
按照公开数据,华为在2023年的开发投入达到了1615亿元人民币,开发花费率为25.1%。近十年来,华为累计投入的开发花费超过9773亿元。截止2023年底,华为有20.7万名员工,其中开发员工约11.4万名,约占员工总数的55%。
日前,盘古大模型已然在10多个行业得到应用,并与多家机构制品和业务深入绑定。
1. 拓维信息
拓维信息是软硬一体化制品及处理方法供给商,亦是华为云首批同舟共济合作伙伴、华为“大模型+鲲鹏+昇腾AI+开源鸿蒙”全方位战略合作伙伴,
拓维信息推出垂直行业大模型——交通CV大模型,按照机构介绍,交通CV大模型在盘古大模型的基本上进行适配研发,使得模型精度提高了 6.21%,研发时间节约了24倍上下,大大降低了研发成本和难度,日前已在高速公路稽核等场景得到了正式应用。
2023年前三季度,拓维信息开发花费1.46亿元,同比增多36.45%,占营收的7.79%。按照年度数据,拓维信息开发花费率从2018年起始呈现出逐年下降的趋势,2018年为11%,到2023年,预计占总营收比例不足9%。2022年机构开发人员数量1122人,占总员工数的27.9%。
2. 神州数码
神州数码主营业务为云计算和数字化转型、信息技术应用创新、信息技术应用创新,深度绑定华为,基于“鲲鹏+昇腾”生态打造神州鲲泰制品体系。
神州数码推出了人工智能制品——“神州问学”平台制品,该制品不是一款大模型,而是大模型集成和运营平台,从模型、数据、算力、应用四个方向打通各项资源,帮助企业投产和运营自己的大模型应用。
2019年至2023年,神州数码开发花费分别为1.46亿元、1.82亿元、2.40亿元、2.91亿元、3.44亿元,同比增长幅度分别为50.37%、24.92%、32.21%、21.15%、18.21%,近5年累计投入12.03亿元开发花费。截止2022年底,机构开发人员数量为791人,占员工总数的14.98%。
3. 赛意信息
赛意信息面向通信、电子、家电、家居等23个重点行业供给制品及处理方法,携手华为云联合创新,基于盘古大模型的自然语言大模型和视觉大模型,共建盘古制造行业大模型。
去年10月,赛意信息发布业界首个聚焦企业服务大模型的AIGC中台(善谋GPT),能够为企业供给多模型对接、向量管理、私有模型预训练与应用等能力,有多种应用场景,包含数字员工(智能引导)、智能单据(智能辅助)、企业知识库(智能问答)、AI自动报价(智能报价)等。
按照公开信息,2018-2022年,赛意信息开发投入稳步增多,2022年开发花费达到2.69亿,同比增长35.37%,开发花费率达11.84%;23年前三季度开发花费2.3亿,同比增长27.21%,占营收的13.67%。开发团队人员数量从2017年末的412人增多到2022年末的2927人,开发人员占比亦突飞猛进,从2018年末的15.11%增多到2022年末的47.49%。
4. 超图软件
超图软件是聚焦地理信息软件与空间智能行业的基本软件与应用软件厂商,与华为合作非常紧密,机构GIS基本软件全面支持鲲鹏、openguass、欧拉、鸿蒙、昇腾及AI等方面的技术。
在2023地理信息软件技术大会上,超图正式发布SuperMapGIS系列制品的最新版本——SuperMapGIS2023,同期发布了多个制品,包含跨平台遥感影像处理桌面软件、跨平台电子海图生产桌面软件、Web端三维地理设计App、三维WebGPU客户端等。
超图软件近年来开发投入逐年加强,2020年、2021年、2022年的开发投入金额分别为2.53亿元、2.68亿元和3.12亿元,分别占营业收入比例15.7%、14.28%和19.53%;23年前三季度开发投入为1.72亿元,同比增长2.21%,占营收的13.53%。2022年,开发人员数量1568人,占员工总数的37.1%,同比增多21.55%。
04
阿里生态 阿里巴巴聚焦于做好“AI时代的云”,为国内大模型供给AI算力底座。国内日前有超过一半的AI大模型机构跑在阿里云上。同期,为推动大模型在千行百业落地,阿里云发布了8大行业模型——通义听悟、通义晓蜜、通义智文、通义星辰、通义灵码、通义法睿、通义仁心、通义点金,让大模型在金融、医疗、法律、编程、个性化创作等行业和场景中更易被集成。阿里新发布的千亿级参数规模的自研基本大模型通义千问2.0,性能显著提高,在10个权威测评中全面超越GPT-3.5和Llama2,加速追赶GPT-4。2022年,阿里巴巴的技术关联成本花费超过了1200亿元人民币。这笔花费用于加强阿里云在中国云市场的领先地位,支撑消费者业务的先进技术需要,并推进对下一代技术的探索。近几年,阿里巴巴每年在技术和开发上的投入都超过人民币1000亿元。仅就开发花费而言,阿里巴巴2023财年(2022年二季度-2023年一季度)开发花费567.44亿元,占营收的7%。截止2023年一季度,阿里巴巴持有23.5万名员工。2021年7月,时任阿里云智能总裁、达摩院院长张建锋在钛媒介峰会,谈到阿里巴巴研发人员为5至6万人;按此计算,阿里巴巴开发人员占比约25%。1. 卫宁健康卫宁健康专注于医疗健康和卫生行业整体数字化处理方法与服务,与蚂蚁集团、阿里体系各机构已然开展了多项合作。去年年底,卫宁健康发布了医疗垂直行业大模型WiNGPT,基于通用大模型的技术,结合高质量医疗数据,针对医疗场景优化和定制,为医疗行业各个场景供给智能知识服务。另外,卫宁健康还发布了基于WiNGPT的医护智能助手 WiNEX Copilot,以及迭代升级后的WiNEX 制品与处理方法。卫宁健康2023年前三季度开发投入2.23亿元,同比增多5.18%,占营业收入的11.73%。2022年,机构开发人员2487人,同比增长9.9%,占员工总数的36.03%。2. 金桥信息金桥信息面向政务、司法、教育、医疗健康、金融等国计民生行业,为客户打造智慧空间信息化处理方法。金桥司法Saas业务日前全国3500家法院全覆盖,与蚂蚁集团已在执行、诉讼服务和智能庭审三大业务方向上持有人工智能的行业处理方法。金桥信息2023年3月在互动平台暗示,机构专注于政法行业的数字化转型,积极布局智慧法院尤其是人工智能方向的创新应用,日前重点是基于主流的大模型结合OCR、NLP、知识图谱、语义分析、设备学习等人工智能技术,为法院的数字化改革供给拥有开创性、引领性的整体处理方法。2023年前三季度,金桥信息开发花费2464万,同比减少1.31%,占营收的4.15%;2022年全年开发花费3990万,同比增多14.26%。按照2022年年报数据,金桥信息开发人员数量273人,占员工总数的35.18%。3. 恒生电子恒生电子聚焦金融行业,为证券、基金、银行等客户供给金融科技处理方法。恒生电子已与阿里通义千问大模型在财富管理行业进行深度合作,双方将来将在包含智能问答、智能外呼、智能助手等业务应用场景进行合作测试,将通义千问强大的自然语言理解和生成能力与恒生电子财富管理域的数据、场景、服务相结合,助力客户服务体验提高。恒生电子自2014年正式起步AI科研工作,日前已发布20多款人工智能制品,打造了NLP、OCR、CV、知识图谱等能力,同期将AI技术能力赋能到智能客服、智能投研、智能运营、智能营销、智能投顾以及数据与危害关联的业务系统。2023年,恒生电子开发花费为26.61亿元,同比增长13.42%,占营收的36.55%;开发人员7,191人,占员工总数的54.52%。
05
澜舟科技 澜舟科技成立于2021年6月,是国内最早一批下场进行大模型创业的团队。去年3月,澜舟发布了孟子GPT V1(MChat);今年1月,孟子大模型GPT V2(含孟子大模型-标准、孟子大模型-轻量、孟子大模型-金融、孟子大模型-编码)对公众开放。近期,澜舟团队完成为了Mengzi3-13B的大模型训练,并颁布了自己的“一横N纵”体系。“一横”是模型层,是孟子大模型技术基本上开发的各个模型;“N纵”则是基于孟子大模型的面向ToB应用最重要的技术和制品。日前,澜舟科技重点投入到了金融行业,辅助编程等行业,旨在经过更加全面、专业、优秀的行业数据,打造更加贴近行业场景的垂直大模型。澜舟科技尚未颁布详细的开发花费数据,然而,从2021年成立败兴,澜舟科技始终致力于预训练模型的开发与应用,并且在不到一年的时间里完成为了数亿元人民币的融资,这些融资重点用于自然语言处理(NLP)核心制品的研发和前瞻性科研。因为澜舟科技与上市机构云从科技、创新奇智达成战略合作,市场上经常将云从科技、创新奇智归为澜舟科技孟子大模型关联概念股,不外,这两家机构亦同期持有自研的通用或行业大模型。1. 云从科技云从科技孵化于中国科学院,围绕AIGC、智慧金融、智慧治理、智慧出行及智慧商场等四大业务行业,是首家在科创板上市的人工智能平台企业。伴同着AI大模型时代来临,云从科技依托自主的预训练大模型和在预训练层调优模型的能力,于去年5月正式推出自研多模态大模型——“从容大模型”,作为“百模大战”中的一员。从容大模型包括但不限于语言大模型、视觉大模型、语音大模型、代码生成大模型以及图像生成大模型等,它经过实时学习并同步反馈结果,能够处理许多AI应用的痛点,从而有利于快速普及个性化应用。上个月,云从科技还发布了3D行径识别基本大模型。云从科技和澜舟科技已然在文档自动化分析和理解行业开展联合研发,针对银行、保险等金融行业、房地产等行业的应用场景,经过OCR和多模态的NLP技术,对合同、文书等类型的文档进行自动化的分析和理解,旨在加强相应行业的自动化程度,帮忙传统行业进行数字化转型,加强生产力和企业运行效率。
2019年至2021年,云从科技开发费为4.54亿元、5.78亿元、5.34亿元,同比增速206.47%、27.29%、-7.60%,占当期总营收比56.25%、76.59%、49.67%;23年前三季度,云从科技的开发花费为3.15亿元,虽然同比下降了26.74%,但营收占比高达91%。历史数据表示,云从科技开发人员在逐年减少,2020年至2022年云从科技开发人员分别为997名、575名、552名;2023年上半年,开发人员522名,较2022年同期减少87名,但占员工总数比例升至60.42%。2. 创新奇智创新奇智是国内最早一批投入工业制造数智化转型的人工智能创新企业,持续探索用前沿AI技术处理工业生产困难。依托在AI制造业的数年累积,在对开源免费大模型进行知识蒸馏的基本上,创新奇智设计了适合工业场景的大模型神经网络结构,推出了面向工业制造行业的百亿参数量级行业大模型“奇智孔明AInnoGC工业大模型”。上个月,创新奇智发布了升级后的奇智孔明工业大模型2.0版本(AInno-75B)及多款大模型原生应用。这次升级后的奇智孔明工业大模型在参数量级上实现了新突破,达到750亿以上,同期加强了海量知识管理、繁杂规律推理、长流程任务编排、Agent智能体以及更加多工业模态的生成能力。
去年3月,澜舟科技与创新奇智携手,发挥各自在计算机视觉、设备学习和自然语言处理技术领域的优良,构建完整AI2.0技术版图,一起探索类ChatGpt、AIGC等前沿技术在制造和金融等行业的技术创新并进行商场化落地尝试。2023年,创新奇智的开发投入为4.5亿元,同比下降8.17%,占营收的25.7%;2022年,其开发投入同比增长27%至4.16亿元,开发花费率由2021年的38.1%降至26.7%。截止2021年底,机构共持有259名技术人员,占机构员工数量的56.7%。
06
字节跳动生态 与其他国内自研大模型相比,字节跳动的大语言模型云雀大模型有些姗姗来迟,在2023年8月首发。这是一个基于字节跳动设备学习平台研发的自然语言内容生成和内容理解的AI大模型。今年4月,云雀大模型将发布重要版本的升级更新。与国内外大模型机构“先通用大模型,后制品应用”的思路区别,素有“应用工厂”之叫作的字节跳动选取在云雀大模型的基本上,打造十几款AI原生应用,包含AI对话制品“豆包”、AI应用平台“扣子”、AI角色互动制品“小悟空”等,日前重点应用于字节跳动旗下制品中。据界面报告,字节跳动旗下剪映已在数月前组建封闭团队,奥密开发AI制品。日前,该团队仍处在严格保密周期,开发的制品还未上线。字节跳动在2022年的开发支出为87亿美元(约629亿人民币),这一数字小于2021年的146亿美元(约1039亿人民币),占2022年营收的10.21%。日前,字节跳动的员工已超10万人,开发人员数量暂未披露。截止去年9月,字节跳动持有掌阅科技股份比例为7.29%。前不久,掌阅宣布正式接入市场上的主流AI大模型,将其运用于内容生成的Prompt Engineering工作,进一步加强了内容创作的效率和质量。日前,关联制品仍处在小范围用户测试周期,推广时间尚不确定。2023年前三季度,掌阅科技开发费用1.78亿,同比增多17.9%,占营收的9.07%;2022年全年开发花费为2.19亿,同比增多28.6%。据2022年数据,机构开发人员293人,占员工人数的35%。
07
小米生态 2023年4月,由小米集团AI实验室专家、自然语言处理(NLP)首席专家王斌牵头负责,小米技术委员会AI实验室大模型团队负责人栾剑带队,在小米内部正式成立了一支自研大模型团队。2023年8月,雷军在年度演讲中透露,小米大模型的主力方向是轻量化和本地安排,让大模型在手机端就能够应用落地。在团队成立到年度演讲的四个月中,小米大模型团队迭代了13亿参数和60亿参数两代制品,截止2023年8月14日,小米60亿参数的自研大模型在C-EVAL权威榜单上取得同参数量级排名第1,在CMMLU中文向大模型取得排名第1。区别于百度的文心一言、科大讯飞星火等通用大模型,小米自研大模型更强调跟制品的结合和场景的驱动,更加多地思虑大模型和小米应用场景的结合,当前重点应用于小米手机、小米汽车、小米智能家居等机构内部业务场景。“人车家全生态”是小米全新升级的将来战略,小米期盼经过大模型这般的基本设备,支撑将来智能生活场景服务。其实在2016年AlphaGo发布后,小米就起始大力投入AI视觉行业,后来逐步拓展到其他行业。小米有3000多人在做AI关联的开发工作,在视觉、声学语音、NLP、知识图谱、设备学习等方向都有技术累积。日前,小米正在和芯片机构合作,一起推动端侧大模型的落地。
同期,小米亦与金山办公密切合作。去年10月,WPS AI在小米14系列手机新品发布会上亮相,展示了WPS 的“随手拍”和“一键生成PPT”两项AI 功能。小米与WPS邀请用户申请体验移动智能办公,小米14系列手机用户可经过小米社区下载搭载WPS AI功能的专属版WPS。2023年,小米开发花费191亿元,同比增长19.2% ,占营收的7.05%;开发人员总计达17800人,触及多个分部,占员工总数的52.93%。从大模型技术外输上看,此前有信息叫作,小米AI大模型的“AI+智能家居”将在趣睡科技实现首个商用落地。小米旗下的顺为资本,是趣睡科技的第二大股东,截止2024年2月8日,持有趣睡科技7.65%的股权。2024年1月,小米与趣睡科技聚焦床上用品品类达成战略合作协议。然而,主打保持“科技加强体验”制品观念的趣睡科技,却始终因科技含量低饱受诟病。2022年,机构开发人员仅42人,占员工总数的28.38%,开发人员数量较少、整体学历不高、流动性大。从开发花费来看,趣睡科技与同行相比亦是垫底。2021年、2022年及2023年前三季度,趣睡科技开发花费分别为804.4万元、683.61万元及478.57万元,分别同比减少30.83%、15.02%及6.46%,开发投入占营业收入比例分别为1.7%、2.12%及2.44%。
08
自研大模型 1. 昆仑万维昆仑万维是集精品自研游戏开发、全世界精品游戏发行商、平台和软件商店三者为一体的综合性互联网平台机构,与奇点智源合作自研“天工”大模型。“天工”具备强大的自然语言处理和智能交互能力,能够实现个性化AI搜索、智能问答、聊天互动、文本生成、编写代码、语言翻译等多种应用场景。基于“天工”,昆仑万维已构建起AI大模型、AI搜索、AI音乐、AI Story、AI游戏等AI业务矩阵。为全面落实机构“All in”AGI与AIGC的战略布局,昆仑万维2023年前三季度开发花费提高至6.2亿元,创上市败兴同期新高,占营收的16.85%;2022年,开发投入金额为7.36亿元,较2021年的6.8亿元增长约17.2%。昆仑万维的开发人员2022年数量为1266人,占员工总数的72.55%。2. 三六零做为国内独一兼具数字安全和人工智能双重能力的企业,三六零基于近二十年在安全和AI行业的技术累积,总结出新一代安全大模型核心战法,3月20日正式推出360安全大模型3.0。三六零叫作,基于类脑分区协同设计的安全大模型框架,三六零安全大模型3.0不仅能够处理任务冲突问题,达到多任务最优性能,况且实现了能力突破,在多个专业任务效果上超过了GPT4。2023年前三季度,三六零开发花费为23.14亿元,同比下滑8.25%,占营收的34.34%,继续保持开发投入高占比。截止2022年底,机构开发人员数量为3602人,占员工人数的55.58%。3. 科大讯飞科大讯飞做为国内知名的智能语音技术供给商,发布了“星火认知大模型”,对标ChatGPT,具备跨行业的知识和语言理解能力,能够基于自然对话方式理解与执行任务。科大讯飞布局“1+N”战略体系,“1”是通用认知智能大模型,“N”则是应用于教育、办公、汽车、数字员工、医疗等多个行业的应用成果。2023年前三季度,科大讯飞开发花费为24.98亿元,较去年同期增长超过1亿元,占营收的19.8%;22年全年开发花费31.11亿元,同比增长9.95%。2022年,开发人员9,281人,同比增长10.92%,在整体员工中的占比提高至61.68%。4. 金山办公2023年初,金山办公宣布All in AI,将LLM能力全面引入制品,发布基于大语言模型的智能办公助手WPS AI。2023年9月,在每年一度的技术开放日上,金山办公首次对外展示了自研模型的最新发展。该模型基于开源底座,进行参数量为7B、13B的小模型训练调优,以满足应用端的细分化场景需要。据金山办公高级副总裁毕晓存介绍,在与国产大模型平台合作的过程中,因为各家API(应用程序编程接口)区别,金山办公做了一个统一的接入层,去调用区别的大模型,而基于大模型的介入成本思虑,小众场景则需要金山办公的自研模型弥补满足需要。日前金山办公合作的通用大模型平台包含MiniMax、百度文心一言、智谱AI,基于大语言模型的智能办公助手WPS AI已接入金山办公全线制品,辅助WPS实现覆盖文档、PPT、表格等形式的内容生成能力。2024年3月底,金山办公联合华科大推出文字多模态大模型TextMonkey,在多项文档理解任务上取得国际领先,向通用文字识别迈出坚实的一步。金山办公CEO章庆元曾暗示,将来金山办公必定会处理大模型自主可控的问题。将来金山办公是不是会推出全自研的大模型,值得咱们期待。2023年,金山办公开发花费14.72亿元,同比增长14.72%,占营收的32.3%;开发人员3087人,占总员工数比例约68%。
09
总结 技术创新高度依赖开发投入。按照上文中的数据,咱们能够发掘,在AI大模型行业,关联上市机构的开发投入有巨大差异,季度开发花费支出从百万级至破数百亿,开发人员数量从数百至上万,这与机构规模、市场定位、模型特点、业务需要以及企业战略规划等多种原因相关。纵观AI大模型关联上市企业,基本大模型开发企业、尤其是多模态企业开发投入巨量,而站在基本大模型肩膀上开发应用端大模型的企业,开发投入相比之下有断层式的距离。区别行业的AI应用层企业,亦因主营业务的区别,开发投入大相径庭。放眼全世界范围,从开发支出总额看,国内企业和国际相比,不仅差距仍大且还在拉开差距。例如,亚马逊在2021年的开发支出为560亿美元,而华为、阿里、腾讯、百度、中兴、美团、京东、快手、网易、小米10家企业2021年开发支出总和为575亿美元,仅比亚马逊高15亿美元。在经济波动的逆流中,稳定而有效地平衡开发投资及其成果产出,是各个企业保证在将来经济周期中保持竞争优良、追赶国际先进水平的关键策略。
END
关注蓝鲨硬科技,紧密跟随科技动态
*本文为蓝鲨硬科技原创,作者飞雪。
欢迎扫描二维码添加蓝鲨首席交流官。
|