一次性生成5个8秒视频，用AI做抖音短视频不是梦？|AI新榜

nqkk58 · 发表于 2024-9-27 15:52:12

近期的AI视频赛道，在玩法上“卷”出了新高度。

有用户用它完善视频细节：

还有人用它创作了科幻大片：

还有大鱼吃小鱼，实现普通摄像头难以拍摄的效果：

较强的灵活性和视频可控性，一下让人难以分辨虚实，而这些镜头都是靠爱诗科技的AI视频工具PixVerse实现的。

PixVerse继4月更新运动笔刷功能之后，今日又重磅上线了PixVerse V2模型。V2支持直接生成长达8秒的视频，乃至能够一次性生成1-5个视频片段，并保准风格、主体和场景的一致性。

PixVerse已然率先朝着AI视频生成的一致性方向发力。这是要进军AIGC短片吗？此次更新的PixVerse V2实力到底怎样？“AI新榜”从角色一致性、想象力、掌控力维度上，第1时间给各位玩家实测了一番。

实测PixVerse新功能：一次性生成5个8秒视频

据认识，PixVerse突破了时长技术限制，能单次生成8秒的视频。但要晓得AI视频生成的时长越长越容易“露怯”，显现瑕疵。那样，其文本理解能力还能稳定发挥吗？咱们先用V2简单测了一下文生视频和图生视频。

文生视频

‍提示词：golden retriever in sunglasses sunbathing on a beach in Hawaii

PixVerse V2版本

PixVerse V1版本

从生成效果来看，动物类的表现很不错，几秒内能够动的细节更加多，例如狗狗的耳朵，毛发。虽然动作幅度依旧比较小，但整体视频呈现得更完整，在视频质量以及清晰度上都有显著的进步。

另一，PixVerse V2升级了模型理解和表达能力，在真实性和细节表达上进一步加强。

提示词：A beautiful women is walking towards the camera

PixVerse V2版本

PixVerse V1版本

能够看到，名人类镜头方面，画面主体无显现尤其大的技术瑕疵，光影效果亦做得很好。相比前一个版本，V2生成的名人动作幅度更大，亦更真实。

但遗憾的是，和其他的AI视频工具同样，仍然是没法理解提示词其中的镜头术语

，如“走向镜头”，画面中主体的运动只是简单转了下头。

图生视频图生视频怎么能少得了这张经典梗图：

在图生视频模式下，咱们无输入任何提示词，想瞧瞧PixVerse V2的“联想”能力怎样。

PixVerse V2并无让图中男生变成“渣男”，而是转过头与红衣女子错失，看多了其他AI视频工具的戏剧效果，PixVerse V2展现的反而有点淡淡的哀伤。

三个人的动作幅度都不大，但难能可贵的是独一显现脸部的红衣女子无显现“变脸”，牺牲了戏剧效果但保准了角色的一致性

。

相比之下，这张“房子着火我微笑”的梗图生成效果就比较通常了。

转头离开，但“变脸”速度巨快：

掌控住了变脸，但场景忽然切换：

要说整活，还是AI在行啊。但总的来讲，图生视频参考了咱们上传的照片元素，玩梗能力在线，做二创是个不错的选取

。

这里前“AI新榜”的短片尝试，以及海量用户反馈和社区讨论反馈中，AI视频的一致性始终是一个困难，更不消说单次生成长达40秒的视频片段了，一块瞧瞧PixVerse V2的多片段生成能力。

生成多片段40秒视频在PixVerse首页点击右侧“PixVerse V2”，就能够进入多片段生成页面，一样支持文生和图生视频。

在这儿，需要咱们选取“Scene 1”，输入相应提示词，再添加“Scene 2”，输入第二个场景想要呈现的画面，以此类推，最多添加5个区别的场景后，一次性生成完整片段。

换句话说，便是把短片的视频分镜，经过自然语言的形式呈现出来

。

从官网发布的信息看，在PixVerse V2模式下，5个场景的画面风格都会与第1个场景保持一致。

倘若咱们还上传了照片，那样这些照片会参考场景1的照片风格进行重绘，保准生成视频风格的一致性。

例如，咱们输入的提示词如下：

Scene 1：the panda is playing the violin.Scene 2：It is playing the piano.Scene 3：It is eating the hamburger.

大约等待5分钟上下，V2一次性生成为了长达16秒的视频片段。能够看到，在视频主体、场景以及画面色调上尽可能保持了一致性，还省去了咱们单个片段持续“抽卡”的时间。

只不外，最后生成的画面在精细度上还有待加强，依旧会显现小提琴、汉堡微变形的画面瑕疵。

倘若咱们对某个片段熊猫的动作、环境、镜头运动不满意，还能够选取替换相应的角色元素，进行二次编辑。

咱们继续尝试一下名人类镜头一致性，将以上提示词中的“panda”换成为了“the woman”，测试了一波V2的角色掌控能力。

没想到的是，PixVerse V2直接规避了短板，生成为了全是近景特写的片段，压根没显现名人。

思虑到是“the woman”太过宽泛，咱们又将主体替换成确切的名人角色“Harry Potter”，测试结果表示，在多片段生成时，名人手指等细节瑕疵无可避免，但场景、风格一致性上发挥稳定。

1秒只需0.1元，AI视频的成本竞赛

今年下半年，AI视频行业掀起了一波应用间的较量，快手可灵、Runway Gen-3等持续面向公众开放运用。

几家制品的面世，都向咱们传递了一个信息“AI视频生成技术更适合短视频制作

”。

除了效果表现之外，持续有AI工具起始采取付费订阅制，快手可灵一样结束了免费试用期，正式迈入了“收费时代”。

快影App内公告

做为AI行业向来绕不开的问题，商场化的困境一样出此刻了视频应用上。

当生成越长的视频，是不是成本就越贵？据调查公司Factorial Funds发帖暗示， Sora约30亿参数的训练成本，比1.8万亿参数的GPT-4还要多。

Factorial Funds对Sora的关联报告

针对AI视频而言，有些生成服务会按照视频的时长、所需处理的视频繁杂性以及运用技术等因素来定价。

倘若AI视频还包含了高度定制化的内容，对视频生成的质量、连贯程度以及真实性有需求，实质所用的推理成本自然就会更高。

曾有媒介报告，国内AI企业做过一个估算，大约两分钟的AI视频实质要花掉180元

。

盈利，是摆在所有AI视频工具面前的一起问题

。哪怕是PixVerse亦扛不住相应的推理成本。

日前，PixVerse推出了订阅套餐方法，基本会员每月5美元，能够得到1150个积分。

PixVerse每生成8秒的视频，需要消耗30个积分，这般算来，1150个积分大约能生成20条完整的15秒短视频，一条短视频的成本折合人民币1.5元，是Runway Gen-3花费的1/3。

当然，背面的技术以及生成视频结果的不确定性，引起实质运用的成本会骤升。

花费之外，针对大都数普通用户而言，短短几秒的视频时间，倘若只是简单的镜头移动，除了得到体验感，很难有真正的运用场景。

爱诗科技创始人王长虎在年初接受采访时亦说到：“在将来6-12个月里，咱们期盼用AI制作出15秒长的可消费内容。仅有当普通人都能用AI生成出好看、好玩的内容，才是AI视频的ChatGPT时刻”。

日前看来，高算力、高成本依旧是商场化的重点阻碍，但不少视频玩家亦从中找到了用户留存的新办法，“AI整活”“老照片动起来”“AI修复”等抽象玩法在互联网上层出不穷。

在大都数用户对AI视频工具的鲜嫩感褪去之后，怎样用新玩法留住用户，摸索出新的挣钱办法，或许会是视频内容玩家下一个竞争赛道。

m5k1umn · 发表于 2024-10-8 12:10:47

对于这个问题，我有不同的看法...

wrjc1hod · 发表于 2024-10-10 17:07:45

你的话语真是温暖如春，让我心生感激。

7wu1wm0 · 发表于 2024-10-30 11:27:08

这夸赞甜到心里，让我感觉温暖无比。

		自动登录	找回密码
密码			立即注册