近期的AI视频赛道,在玩法上“卷”出了新高度。 有用户用它完善视频细节:
还有人用它创作了科幻大片:
还有大鱼吃小鱼,实现普通摄像头难以拍摄的效果:
较强的灵活性和视频可控性,一下让人难以分辨虚实,而这些镜头都是靠爱诗科技的AI视频工具PixVerse实现的。 PixVerse继4月更新运动笔刷功能之后,今日又重磅上线了PixVerse V2模型。V2支持直接生成长达8秒的视频,乃至能够一次性生成1-5个视频片段,并保准风格、主体和场景的一致性。
PixVerse已然率先朝着AI视频生成的一致性方向发力。这是要进军AIGC短片吗?此次更新的PixVerse V2实力到底怎样?“AI新榜”从角色一致性、想象力、掌控力维度上,第1时间给各位玩家实测了一番。
实测PixVerse新功能:一次性生成5个8秒视频
据认识,PixVerse突破了时长技术限制,能单次生成8秒的视频。但要晓得AI视频生成的时长越长越容易“露怯”,显现瑕疵。那样,其文本理解能力还能稳定发挥吗?咱们先用V2简单测了一下文生视频和图生视频。 文生视频
提示词:golden retriever in sunglasses sunbathing on a beach in Hawaii
PixVerse V2版本
PixVerse V1版本
从生成效果来看,动物类的表现很不错,几秒内能够动的细节更加多,例如狗狗的耳朵,毛发。虽然动作幅度依旧比较小,但整体视频呈现得更完整,在视频质量以及清晰度上都有显著的进步。 另一,PixVerse V2升级了模型理解和表达能力,在真实性和细节表达上进一步加强。
提示词:A beautiful women is walking towards the camera
PixVerse V2版本
PixVerse V1版本
能够看到,名人类镜头方面,画面主体无显现尤其大的技术瑕疵,光影效果亦做得很好。相比前一个版本,V2生成的名人动作幅度更大,亦更真实。 但遗憾的是,和其他的AI视频工具同样,仍然是没法理解提示词其中的镜头术语
,如“走向镜头”,画面中主体的运动只是简单转了下头。 图生视频图生视频怎么能少得了这张经典梗图:
在图生视频模式下,咱们无输入任何提示词,想瞧瞧PixVerse V2的“联想”能力怎样。
PixVerse V2并无让图中男生变成“渣男”,而是转过头与红衣女子错失,看多了其他AI视频工具的戏剧效果,PixVerse V2展现的反而有点淡淡的哀伤。 三个人的动作幅度都不大,但难能可贵的是独一显现脸部的红衣女子无显现“变脸”,牺牲了戏剧效果但保准了角色的一致性
。
相比之下,这张“房子着火我微笑”的梗图生成效果就比较通常了。 转头离开,但“变脸”速度巨快:
掌控住了变脸,但场景忽然切换:
要说整活,还是AI在行啊。但总的来讲,图生视频参考了咱们上传的照片元素,玩梗能力在线,做二创是个不错的选取
。
这里前“AI新榜”的短片尝试,以及海量用户反馈和社区讨论反馈中,AI视频的一致性始终是一个困难,更不消说单次生成长达40秒的视频片段了,一块瞧瞧PixVerse V2的多片段生成能力。 生成多片段40秒视频在PixVerse首页点击右侧“PixVerse V2”,就能够进入多片段生成页面,一样支持文生和图生视频。
在这儿,需要咱们选取“Scene 1”,输入相应提示词,再添加“Scene 2”,输入第二个场景想要呈现的画面,以此类推,最多添加5个区别的场景后,一次性生成完整片段。 换句话说,便是把短片的视频分镜,经过自然语言的形式呈现出来
。
从官网发布的信息看,在PixVerse V2模式下,5个场景的画面风格都会与第1个场景保持一致。
倘若咱们还上传了照片,那样这些照片会参考场景1的照片风格进行重绘,保准生成视频风格的一致性。 例如,咱们输入的提示词如下:
Scene 1:the panda is playing the violin.Scene 2:It is playing the piano.Scene 3:It is eating the hamburger.
大约等待5分钟上下,V2一次性生成为了长达16秒的视频片段。能够看到,在视频主体、场景以及画面色调上尽可能保持了一致性,还省去了咱们单个片段持续“抽卡”的时间。
只不外,最后生成的画面在精细度上还有待加强,依旧会显现小提琴、汉堡微变形的画面瑕疵。 倘若咱们对某个片段熊猫的动作、环境、镜头运动不满意,还能够选取替换相应的角色元素,进行二次编辑。
咱们继续尝试一下名人类镜头一致性,将以上提示词中的“panda”换成为了“the woman”,测试了一波V2的角色掌控能力。 没想到的是,PixVerse V2直接规避了短板,生成为了全是近景特写的片段,压根没显现名人。
思虑到是“the woman”太过宽泛,咱们又将主体替换成确切的名人角色“Harry Potter”,测试结果表示,在多片段生成时,名人手指等细节瑕疵无可避免,但场景、风格一致性上发挥稳定。
1秒只需0.1元,AI视频的成本竞赛
今年下半年,AI视频行业掀起了一波应用间的较量,快手可灵、Runway Gen-3等持续面向公众开放运用。 几家制品的面世,都向咱们传递了一个信息“AI视频生成技术更适合短视频制作
”。 除了效果表现之外,持续有AI工具起始采取付费订阅制,快手可灵一样结束了免费试用期,正式迈入了“收费时代”。
快影App内公告
做为AI行业向来绕不开的问题,商场化的困境一样出此刻了视频应用上。 当生成越长的视频,是不是成本就越贵?据调查公司Factorial Funds发帖暗示, Sora约30亿参数的训练成本,比1.8万亿参数的GPT-4还要多。
Factorial Funds对Sora的关联报告
针对AI视频而言,有些生成服务会按照视频的时长、所需处理的视频繁杂性以及运用技术等因素来定价。
倘若AI视频还包含了高度定制化的内容,对视频生成的质量、连贯程度以及真实性有需求,实质所用的推理成本自然就会更高。 曾有媒介报告,国内AI企业做过一个估算,大约两分钟的AI视频实质要花掉180元
。 盈利,是摆在所有AI视频工具面前的一起问题
。哪怕是PixVerse亦扛不住相应的推理成本。 日前,PixVerse推出了订阅套餐方法,基本会员每月5美元,能够得到1150个积分。
PixVerse每生成8秒的视频,需要消耗30个积分,这般算来,1150个积分大约能生成20条完整的15秒短视频,一条短视频的成本折合人民币1.5元,是Runway Gen-3花费的1/3。
当然,背面的技术以及生成视频结果的不确定性,引起实质运用的成本会骤升。
花费之外,针对大都数普通用户而言,短短几秒的视频时间,倘若只是简单的镜头移动,除了得到体验感,很难有真正的运用场景。
爱诗科技创始人王长虎在年初接受采访时亦说到:“在将来6-12个月里,咱们期盼用AI制作出15秒长的可消费内容。仅有当普通人都能用AI生成出好看、好玩的内容,才是AI视频的ChatGPT时刻”。
日前看来,高算力、高成本依旧是商场化的重点阻碍,但不少视频玩家亦从中找到了用户留存的新办法,“AI整活”“老照片动起来”“AI修复”等抽象玩法在互联网上层出不穷。 在大都数用户对AI视频工具的鲜嫩感褪去之后,怎样用新玩法留住用户,摸索出新的挣钱办法,或许会是视频内容玩家下一个竞争赛道。
|