撰文 | 李信马
题图 | 京 东
刚才过去的“618”,火了一群“AI主播”。
直接看战报吧,2024年“618”时期,京东直播订单量同比增长超200%。其中,京东云言犀数字人: 在超过5000个品牌直播间开播;
累计时长超过40万小时;
累计观看人次超过1亿;
互动频次超过500万次。根据京东的统计,截止日前,言犀数字人已累计带动了超百亿的GMV(商品交易总额)。这个数字,放在今天的直播带货行业,实在不算个大数字。
据艾瑞咨询刚才发布的《2023年中国直播电商行业科研报告》表示,2023年,我国直播电商市场规模高达4.9万亿人民币,增速达到35.2%,并预测将来三年还将保持18%的年复合增长率。100亿,乃至比不外头部达人的年度GMV。
不外,对京东来讲,这算是很不错的成绩。在直播带货赛道如火如荼之际,老牌电商平台京东却掉了队,谈到直播带货达人,淘宝有李佳琦,抖音有疯狂小杨哥、罗永浩,快手有辛巴,而京东却让人想不到有能够相提并论的。
虽然近一年来,京东没少花心思做直播,但培养头部达人并不是个容易速成的事情。山不转水转,用AI数字人主播代替真人主播,作为一种“弯道超车”的选取。
从京东“618”战报来看,AI主播亦算是小有成绩。只是,这般的成绩会是昙花一现,还是真的能走出一条通天大路?
1、日不落的直播间
前几天,“钟薛高老林”直播间出现了惊魂一幕,女主播在介绍制品时,忽然身体起始摇晃,而后猛然摔倒,伴同着直播间里的尖叫声,专题亦冲上热搜第1。
好在虚惊一场,女主播暗示只是身体不适。不外,就这事而言,却表现了AI主播相比真人主播的优良之一:不会疲惫,亦不必须休憩。
DoNews联系了一位资深带货主播嘉琪,在咱们和她讨论AI主播时,她的第1反应是,有了AI主播,直播间就能够“日不落”了。
“直播带货最少一个主播一个助播,还要有人投流,亦就上班时间能凑一块,至于达人,更不可能始终播。”嘉琪日前每周单休一天,工作日每日直播4小时。而她所在的机构,同一个直播间会由三名主播早中晚三班轮班,一天播满12小时。
每日24小时,嘉琪所在的直播间只播一半,重点问题便是剩下的时间能够挣钱,但性价比不高。例如她们的最后一班是夜晚7点半结束,之后到11点半的4小时,直播带货的效果不必定比白日好,但成本和麻烦程度只高不低,因此呢就被机构放弃了。
按嘉琪估计,她们直播间平均每日GMV在4万元上下,投流的成本大约是1万元,而主播的工资是200元每小时。“每一个平台的投流不太同样,例如小红书是点进来(直播间)一次咱们要给2块多,抖音是另一套规则,它们投流很细。”
因此呢,流量高的黄金时段,要直播况且要多投流;流量低的闲时,投流没道理,纯自然流量可能连人力成本都覆盖不了,就不必直播了。
至于200元/小时的收入水平,在北京的直播带货圈子里算中等偏上,嘉琪介绍,区别平台、区别品类的直播间主播的收入水平会有所差异,另外还会有区别比例的提成点,“像是服饰类,提成可能在2%-5%,但像粮油这般的,可能就仅有千分之几了。”
能有这般的薪水,是由于直播带货的确有其门槛,她们直播间表现最好的一天,GMV达到了25万,投流成本不到3万,除了运气和制品营销策略,主播的个人能力影响很大。
况且这亦是“体力活”。“一场直播下来,可能就休憩几分钟,去上一次洗手间,每日4小时感觉不多,但连续播一段时间就会很疲惫,嗓子亦会难受。”嘉琪差不多一月会请假一两次来休憩,不请假的话“卷”两个月,她就要休憩一个小长假才可恢复过来。
相比真人,AI主播的成本非常优惠,闲时亦能够始终在线。例如京东,就暗示言犀数字人直播成本仅为真人1/10,在今年4月,百度发布了曦灵数字人,采访中百度智能云副总裁喻友平亦对DoNews暗示,在不投流的状况下,6小时直播比对中,数字人的成本大概是真人的15%上下,GMV则是真人85%。
京东对运用数字人直播有三个周期的目的,其中第1周期是向真人看齐,能够和真人接力,在黄金时段之外带货。有AI主播做闲时补充,直播间能够24小时日不落,例如联想的京东直播间,据统计AI主播的每小时成交量,能达到真人的45%,成本仅有10%;珠宝品牌潮宏基的AI主播平均每日播22小时,每月比真人10小时直播能省下两三万。
只是,倘若AI主播止步于降本,那就不值得讨论了,由于直播带货行业还是营销为王。而从今年京东“618”来看,AI主播表现出来了更大的潜能——亦许真的能够替代真人。
2、AI主播是怎么样炼成的?
AI主播并不是鲜嫩事,2022年起,言犀虚拟主播就在青蛙王子、六神、同仁堂、百雀羚等上百家国货品牌直播间上岗,在去年的“618”,京东曾发布信息“开门红开启10分钟,言犀虚拟主播开播商家较去年11.11增幅近4倍”。
但以前没火起来,本质还是太“菜”了,完全比不上真人。
在百度发布曦灵数字人时,喻友平的描述就很谦虚:“将来要覆盖到更加多本来都无能力做直播的商家或企业,让她们能够低成本的把直播用起来。虽然客观来讲,肯定没法代替哪些顶级的直播,没法达到她们那样高的水平,然则达到70%的水平,或说咱们随便找10个素人出来,肯定比她们水平高。”
而同一时间,京东却选取挑战高难度。在4月16日,京东直接做出了刘强东的AI数字人“采销东哥”,并亮相直播间开启了首场直播卖货。
直接上“老板”卖货,有魄力亦很好玩,看一下营销数据:在42分钟的上播时间里,“东哥”讲解了13款制品(重点是家电),直播间的观看数量超过了2000万,创下了京东超市采销直播间开播败兴观看人数的最高峰,最后订单数突破了10万,营销额超过了5000万元。
照片源自:京东
DoNews当时亦特意观看了这场直播,说实话,前面一小段时间,真的没分辨出是不是真人,不止是长得像,一口宿迁味的普通话亦颇具迷惑性。(亦有原由是一起始的信息“京东创始人、董事局主席刘强东即将在京东APP上开启直播”中无说是AI主播)看了一会,才隐约觉得表情和微动作有些重复和不自然。而多久能分辨出来是不是是真人,便是京东对AI主播进行效果评判的核心指标。
京东云言犀负责人在第1次直播后的采访中说:“观众在进入直播间的前120秒,倘若不觉得是数字人,就有可能跨过‘恐怖谷’效应,对主播产生信任感。这能大幅加强下单率。”
一旦跨越了这条鸿沟,AI主播就能够进入京东预期的第二周期:媲美真人,能够承担有些重要独立的任务,例如重要时段的直播、讲解等。以“采销东哥”为起点,“618”的京东直播间里,冒出了不少“AI老板”,有格力董明珠、海信胡剑涌、LG李东善、名创优品叶国富、洁丽雅石展承等十几位企业总裁,亦算是赶上了雷军、周鸿祎等商界大佬直播的热潮。
能达到这般的效果,不得不说,要感谢人工智能尤其是大模型技术的突飞猛进,咱们此刻管训练大模型叫炼丹,那京东的AI主播,便是主打一个“菜就多炼”。简单的说下,京东言犀数字人背面的技术。
创立数字人形象,重点分为外观和声音两部分。以“采销东哥”为例,在外观部分,言犀团队利用刘强东的高清视频,协同 3D Mesh 技术方法,快速创立拟真的真人形象,并支持数字人做出大姿态、有感染力的动作,例如挥舞手臂,或侧脸看手机。简单理解,便是专精名人视频生成的“Sora”。
在声音方面,言犀团队设计了声音供应链的概念,从起始供应声音最基本的元素上进行规范,制定标准,后面技术进行相应的适配。模型在预训练中已然把握了人类广泛的发声特征,再录制几句刘强东讲话,就能学习到他“宿迁普通话”的说话风格。直播中一句东哥特殊的“兄弟们”,谁听了不迷糊?
3、畅想:将来的AI主播会是怎么样?
以假乱真是很厉害,但大众看直播,不只是为了看“真实”。
除了折扣外,消费者亦爱好看主播们唱跳Rap,最好再给家人们上上才艺整整花活儿。眼下AI主播们的风头,其实是借着商界大佬们的形象,颇有些“狐假虎威”的意思,绝大都数人一生亦听不到刘强东面对面喊自己一声“兄弟”,更不消说给介绍下商品了。
另一方面,因为多种原由,直播带货行业正由达人带货向店播的模式倾斜,再加上近期流行“一把手”出镜(但有时间和能力的企业家并不多),因此呢,京东带头发起的““总裁数字人直播”能够说搔到了不少企业的痒处。
等鲜嫩感过去后,AI主播还能吸引消费者们观看和购买吗?毕竟,日前的AI主播,只能在直播间里说话做表情,并不具备真正人类的行动力。反观真人直播带货还在持续的推陈出新,例如 ZARA 在去年年底的一场直播,请来了超模游天翼现场走秀。
空间挑高近8米,面积达500平,有5台阿莱摄影机和3台斯坦尼康等顶尖设备,再加上轨道车与机械摇臂,12盏阿莱400W聚光灯,这般超豪气的配置,营造出了最少价值50万的光影效果。长达约5小时的直播里,镜头全程跟踪超模与两位主播,从T台走秀到介绍制品、分享时尚见解,乃至补妆的小细节亦毫无保存地展示出来,这般的视觉盛宴,吸引了近122万的观众。
照片源自:抖音
这般的直播,此刻的AI主播显然做不到。
一样是在4月时,DoNews采访了虚拟动点董事长刘耀东,虚拟动点专注于空间计算技术,她们的一大业务是做电影动作特效。刘耀东说到一个观点,此刻的视频生成技术,包含Sora,都“不懂理学世界”。不懂理学世界的结果,便是生成的视频,会出现“穿模”的问题。而问题的原由,是由于咱们平常看的视频、电影,本质上便是二维图像的堆叠,因此大模型在训练时,得到的数据亦是加上时间轴的二维图像集,这般生成的视频其实亦是图像的组合罢了。
“你会发掘,所有电商(AI主播)直播的场景,(AI)主播是不可动的,它只能同轴位移,便是手能够动,表情能够动,但身体不可动。为何它不可离开这个轴?由于它是拿视频训出来的,便是一个人坐在那里,拍足够多的视频来训练这个AI,而后再用口型和声音数据同步训练它的表情。它倘若大幅度移动的话,就会出现显著的抖动等其他问题。”刘耀东解释道。
倘若AI主播始终在画面正中间,那问题不大,但除此之外——例如只是简单的站起来——那问题都很大。虚拟动点一样经过大模型训练数字人,但她们采集的空间数据是三维的,和视频数据的区别大概相当于(x,y,z,T)和(x,y,T),这般从基本上处理大模型“不懂理学世界”的问题,而刘耀东理想中的AI主播,能够站起来,能够走动、做平常动作,乃至能够做物理交互。
“我觉得倘若真的要实现到理想中的电商直播场景,那必定要有同步的一套AI算法,加上咱们动作的算法,进行重新组合,完成数字人的驱动,它肯定不会是一个二维数字人。”刘耀东总结道。
不外,这般灵活的AI主播距离咱们还有些遥远,真人主播为主、AI主播为辅,两者共存的模式将来将在电商直播行业长时间存在,并且行业仍充满了机会,用真金白银奖励技术和模式上的突破。
畅想一下,将来可能便是《头号玩家》或《失去控制玩家》里的场景。可能有一天,科技已然进步到构建出电影里的虚拟世界,亦许真人主播不会消失,但AI主播却能够飞天遁地,再也不必须模仿真人,就能完成令咱们惊叹的扮演了。返回外链论坛:www.fok120.com,查看更加多
责任编辑:网友投稿
|