近一年来,具身智能毫无疑问作为了国内外产业界、学界和投资界重点关注并大力投入的硬科技赛道之一。各方资源的连续重磅投入让行业发展进入快车道,各家具身智能企业接连发布新品发展,亦持续有区别新创企业得到亿元级别的初期融资。
9月25日,2024百度云智大会“具身智能专题论坛”在北京中关村国际创新中心圆满落幕,这次论坛现场座无虚席,并经过在线直播的方式,吸引了数万网友在线观看。
这是百度智能云首次在一年一度的“云智大会”中设立具身智能这一专题的分论坛,在这次的专题论坛中,来自各界的专家学者针对具身智能的总体发展状况、关键技术问题和自己所在企业的宝贵实践进行了多场重磅分享和精彩对话。
专题论坛现场
在主办单位分享环节,百度智能云分享了她们近一年来对具身智能赛道的有些洞察和实践,并正式对外重磅发布和介绍具身智能赛道处理方法,向外界全面分享了她们做为云厂商对具身智能赛道的思考以及参与推动赛道发展的模式。
在主题分享环节,大会邀请中山大学智能工程学院副教授、博士生导师梁小丹与中金资本执行总经理毛祎琛对具身智能赛道发展状况进行诠释。另外,清华大学交叉信息科研院博士生导师/清华大学视觉与具身智能实验室专家/千寻智能联合创始人高阳、北京具身智能设备人创新中心大模型负责人鞠笑竹、星海图联合创始人兼CEO高继扬以及NVIDIA中国区设备人业务负责人李雨倩亦分别发布了重要主题分享。
在圆桌对话环节,由主持人BV百度风投高级投资经理轲迪与X Square创始人兼CEO王潜、北京大学计算机学院助理教授/科研员/博士生导师仉尚航、北京银河通用设备人有限机构合伙人/大模型负责人张直政、UniX AI创始人兼CEO杨丰瑜以及面壁智能联合创始人兼CTO曾国洋五位专家学者围绕多个具身智能关联重要技术问题和应用落地展望进行了精彩对话和深度探讨。
▍百度智能云与赛道各方携手加速具身智能新物种进化
百度智能云泛科技业务部总经理张玮首要发布致辞,分享了团队从去年起始投入到具身智能赛道的有些思考判断。他分享了团队去年在投入具身智能赛道的机会选取上结合技术、政策等外边原因的决策判断思考,以及结合赛道的周期性发展特点,知道百度智能云在该赛道的生态价值定位重点是协同多方合作伙伴一块服务好赛道的整机厂商企业,助力厂商加速构建具身智能设备人制品的系列核心能力,助力加速制品落地进程。
百度智能云泛科技业务部总经理 张玮
▍学界和投资界专家深度分享具身智能赛道总体技术及市场发展状况
中山大学智能工程学院副教授、博士生导师梁小丹,深入剖析了具身智能关键技术发展状况并分享了后续技术发展趋势观点。梁小丹指出,具身智能做为一个高度集成化的系统,其发展离不开硬件、算法及数据等多方面的协同,全面系统分享了具身智能体总体框架以及各方向关键技术。另一亦分享了在开源数据、开源仿真和开源模型上已取得的有些工作成果,强调了数据在具身智能发展中的核心地位,指出高质量、多样化的数据集针对训练出高性能的具身智能模型至关重要。
中山大学智能工程学院副教授、博士生导师 梁小丹
中金资本执行总经理毛祎琛亦对具身智能赛道的快速发展背景、产业链状况和后续发展趋势进行了深入分享。毛祎琛强调了技术、硬件与场景应用三者的紧密结合针对推动具身智能发展的重要性。她认为,虽然当前行业仍面临数据匮乏、硬件成本昂贵等挑战,但随着技术的进步和生态链的逐步完善,具身智能将在工业制造、商场服务等多个行业展现出巨大的商场潜能。尤其是中国市场,凭借庞大的需要基本、丰富的应用场景以及政府的支持政策,有望在具身智能行业实现弯道超车。
中金资本执行总经理 毛祎琛
▍百度智能云致力于全方位助力赛道企业构建具身智能设备人制品核心能力
在这次云智大会首次设立的具身智能专题论坛上,主办单位对外重磅发布并介绍了其具身智能赛道处理方法。百度智能云泛科技行业具身智能赛道负责人张龙君首要弥补介绍了团队去年决定投入到该赛道时的有些内外边原因考量,以及阐述了结合赛道企业当前的核心重点任务,说明百度智能云当前参与该赛道的生态定位便是助力赛道厂商企业把具身智能设备人制品的有些关键核心能力加速构建好。
基于参与赛道发展的生态定位,张龙君介绍了百度智能云具身智能赛道处理方法,以及在区别合作方向上与赛道企业的合作推进状况。方法着眼于助力赛道厂商更好地处理制品落地面临的一系列挑战,结合百度智能云的优良技术和制品方法,相应可供给赋能的方向重点包含:
1)供给行业领先的文心大模型、合作伙伴面壁智能的端侧大模型,以及百度智能云千帆大模型服务与研发平台助力构建具身大脑;
2)供给云上仿真平台助力企业加速小脑运控算法训练迭代和生态研发者的拓展;
3)供给专业化和规模化的数据采集和数据标注服务助力具身智能数据集建设;
4)供给远场语音交互方法助力整机制品构建出色的人机语音交互体验;
5)供给云管端一体化的安全方法为制品从开发到落地运营全周期保驾护航;
6)供给高性能稳定靠谱的云上AI算力及AI Infra技术平台支撑各类模型的有效训练工作;
百度智能云泛科技行业具身智能赛道负责人 张龙君
▍专题分享:围绕具身智能关键的操作能力、数据集建设、落地技术框架和仿真平台开展深度分享
在专题分享环节,首要针对直接决定具身智能设备人制品是不是“有用”的核心能力——“操作”展开介绍。清华大学交叉信息科研院博士生导师、清华大学视觉与具身智能实验室专家、千寻智能联合创始人高阳围绕“具身操作框架及操作技能学习的科研与实践”进行了深入分享。高阳指出在设备人技术行业,适应繁杂环境的操作能力是关键挑战之一,他介绍了其科研团队早前提出的具身智能操作框架CoPa,经过利用基本模型中嵌入的常识性知识,CoPa极重地加强了设备人在开放世界场景中的操作能力。另外,高阳还分别介绍了General Flow和具身智能体有效学习的两项技术科研成果,关联技术成果能让设备人从人类操作视频中学习并迁移到新任务中,有效提高了设备人的自主学习能力。
在该专题分享的最后,高阳经过demo视频展示了千寻智能近期对外披露的正开发中的设备人出色的连续长程任务执行能力。另一,他亦透露了日前千寻智能AI技术团队正快速扩张,欢迎技术能人的加入。
清华大学交叉信息科研院博士生导师、清华大学视觉与具身智能实验室专家、千寻智能联合创始人 高阳
具身数据集是具身智能技术进步的核心驱动力之一。当前,北京具身智能设备人创新中心正联合产业链各方致力于构建“具身智能设备人规模最大、信息最稠密、最通用的高质量具身智能数据集”,创新中心大模型负责人鞠笑竹博士带来了“大规模具身智能数据集建设实践”的重要专题分享。
鞠笑竹介绍了创新中心对数据集建设工作期盼兼顾产业科研和学术科研的思考、业界已有数据集的局限性,重点分享了创新中心在数据集、数据母机、数据应用和数据平台上的全面布局和实践。经过鞠博士的介绍,观众得以一睹做为国内首个设立的省级人形设备人创新中心,该中心在具身智能数据集建设上深入领先的工作。
在分享的最后,鞠笑竹亦介绍了正与百度智能云紧密合作推进数据采集工作的状况,在人形设备人和机械臂等多类型本体上快速推进高质量真实数据和仿真数据的规模化采集。
北京具身智能设备人创新中心大模型负责人 鞠笑竹
星海图联合创始人兼CEO高继扬结合团队在具身智能感知和操作算法的领先累积、前沿技术制品落地能力以及自动驾驶大规模量产的宝贵经验,围绕“具身智能技术落地实践及制品商场闭环要素的洞察”展开深度分享。高继扬在分享中说到,星海图日前正专注于打造“一脑多形”具身智能设备人,在具身本体、端到端AI算法、场景处理方法均布局全栈自研,他强调了智能体的智能边界确定的重要性,认为这是新一代具身智能制品开发的规律转变。在制品设计上,星海图遵循“智能定义本体”的理念,即围绕智能的需要和边界来设计设备人本体,而非从结构出发。
另外,高继扬还分享了对“智能边际成本”的深刻洞察,认为智能的边际成本决定了机构的竞争力。星海图经过自研全尺寸具身智能本体以及核心零部件,结合仿真和真实数据,致力于降低新任务的学习成本,即数据成本,从而推动制品的快速迭代和商场化进程。
星海图联合创始人兼CEO 高继扬
NVIDIA的Isaac平台广受设备人研发者的欢迎和运用,GTC 2024大会上亦颁布了针对人形设备人的多项重磅更新。来自NVIDIA中国区设备人业务负责人李雨倩仔细介绍了NVIDIA在设备人行业的布局、Isaac平台的优良,以及NVIDIA在加速具身智能应用研发方面的策略和生态合作工作。
李雨倩暗示,NVIDIA在设备人行业日前三大布局包含:训练、仿真和Runtime。她尤其说到了Isaac平台,包括了设备人仿真平台Isaac Sim和强化学习训练平台Isaac Lab。经过展示一系列应用案例,例如合成数据集,强化学习训练以及人形设备人等,李雨倩展示了Isaac平台在提高设备人AI功能研发效率和性能方面的特有优良。
另外,李雨倩进一步分享了NVIDIA在加速具身智能应用研发方面的策略。她仔细介绍了NVIDIA供给的预训练模型和工具链,这些资源能够助力研发者快速搭建智能设备人应用。另一,NVIDIA亦在与百度智能云等合作伙伴一起推进云上仿真服务的安排,以供给更加便利的平台来加速具身智能应用的研发。
NVIDIA中国区设备人业务负责人 李雨倩
▍圆桌对话:围绕具身智能技术问题和落地前景展开多元、有深度的对话和畅想
圆桌对话环节,由具备丰富具身智能赛道实践经验的BV百度风投高级投资经理轲迪担任主持人,对话嘉宾由五位科研方向多元的资深技术专家和创业者组成,包含:X Square创始人兼CEO王潜、北京大学计算机学院助理教授/科研员/博士生导师仉尚航、北京银河通用设备人有限机构合伙人/大模型负责人张直政、UniX AI创始人兼CEO杨丰瑜、面壁智能联合创始人兼CTO曾国洋。
圆桌对话专家阵容
BV百度风投高级投资经理 轲迪
在大模型对科研范式的改变这一话题上,张直政认为自大模型显现后,因其通用性和泛化性极强,使得传统办法需要被重新思考。他强调,科研范式正逐步从过去的针对单一任务研发特定掌控算法,转变为基于大模型的训练与系统构建,这对设备人行业带来了巨大影响,促进研发者们更加关注数据与模型的闭环,以及怎样在详细场景中安排和应用大模型。
北京银河通用设备人有限机构合伙人 张直政
在技能涌现的可能性与挑战上,王潜指出,技能涌现有两种显现的路径,第1种是在模型泛化性提高的过程中显现的突变,日前大部分模型的泛化性能力广泛局限在适应简单的理学环境和硬件配置变化,以及操作未经训练的新物体上,而泛化性能够提高到自主执行从未示范过的新任务时能够被叫作为技能涌现。他分享了X Square经过模型基本能力的提高实现了从未报告过的高级泛化和技能涌现的训练实践,他认为这种能力只能经过端到端的统一基本模型,经过足够多样的数据和场景训练,习得理学规律与技能策略的通用结构而实现。第二种实现技能涌现的路径则需要引入含有尝试-评定-纠正的思维链能力。与GPT-4等善于的语言任务区别,在具身智能任务中实现这类能力需要额外的模型来准确评定状态的转移,因此呢世界模型将是这条路径上的关键组件。而张直政则分享了银河通用经过大规模仿真合成数据训练模型,已观察到有些未在训练中见过的技能涌现现象,并强调仿真数据在技能涌现科研中的重要性。
X Square 创始人兼CEO 王潜
针对世界模型的重要性和应用方面,王潜分享了X Square训练世界模型及将其应用于具身智能任务的实践,并认为短期内区别任务行业需要模型预测的侧重点区别,因此呢需要多种区别的世界模型,而将来大一统的全面世界模型则是一种超越人类能力的可能方向。
杨丰瑜认为,世界模型能够学习环境的内部表征并预测将来状态,对实现AI的数据闭环至关重要。他强调,世界模型不仅能够生成数据,还能生成策略与动作,推动具身智能任务的端到端处理。
杨丰瑜同期指出,世界模型的打造任重路远,生成和仿真是两条区别路径。仿真有它的优良,亦有不可避免的坏处端,它不必定遵从理学世界的规律。其次,在理解真正理学世界变化的规律之后,怎样将其做到神经网络里面,做到算法里面,肯定是一个非常长时间的过程。今天人类尚未完全探索出世界全面运转的规律,咱们只能用先验知识加上神经网络,持续逼近越来越真实和全面的世界模型。将来大一统的世界模型将超出人类想象,这亦是驱动无数人为之奋斗和奋斗的动力源泉。他另一介绍道:“UniX AI此刻重点经过真实数据的采集来进行人形设备人的训练,基于独有的视触觉底层大模型Unitouch,指点设备人的操作,日前发展非常良好。UniX AI将加快数据采集的工作,让设备人在家庭等繁杂场景中的应用更加全面。”
UniX AI创始人兼CEO 杨丰瑜
曾国洋则进一步指出,世界模型的核心在于对世界变化的建模与理解,尽管日前仍存在很大挑战,但其对将来AI的发展拥有革命性道理。
面壁智能联合创始人兼CTO 曾国洋
在讨论中,嘉宾们还就数据在具身智能开发中的重要性发布了各自看法。张直政强调,银河通用在构建具身基本模型周期,仿真数据的运用比例高达90%以上,以快速有效地将数据量scale up到大模型所需要的量级。
王潜则认为仿真针对高层次决策、导航等任务来讲是低价海量易标注的数据源自,但现实世界数据针对实现高精度操作任务来讲尤为重要。同期因为两种数据用于训练模型的效率区别,随着现实世界数据成本的下降,在以通用精细操做为表率的任务中其综合成本有望追平乃至小于仿真数据。
北京大学计算机学院助理教授、科研员、博士生导师、博雅青年学者 仉尚航
在圆桌对话的最后部分,嘉宾们分享了各自的将来愿景及面临的挑战。仉尚航介绍了过去十余年人工智能科研范式的转变,表达了对以具身智能为载体的通用人工智能的期待,并指出当前具身智能科研仍需在数据模型闭环中齐头并进。曾国洋则梦想着打造像《钢铁侠》里面贾维斯同样的智能助手,全面拓展人类能力。杨丰瑜强调了陪同型设备人在教育、医疗等行业的应用潜能。王潜则从技术方向阐述了大模型对数据多样性的需求。张直政则从商场化方向出发,探讨了数据飞轮构建过程中的挑战与机遇。
▍结语与展望
这次2024百度云智大会“具身智能专题论坛”为产业界、学术界和投资界等各参与方搭建了一个多方交流、碰撞思想的重要平台,取得了圆满成功。
相信这次论坛将作为各方参与具身智能大航海时代过程中的重要一站,以此做为新的起点继续携手加速具身智能新物种的进化,加速奔赴具身智能的星辰大海!返回外链论坛: http://www.fok120.com,查看更加多
责任编辑:网友投稿
|