视频AI卷向5分钟：全量开源，一次生成，正式告别“盲盒抽卡”

编辑｜泽南、杨文

AI 视频生成，卡在长视频这道坎上太久了。

过去一年，视频生成赛道动作频频。谷歌推出 Veo 系列，并在今年 I/O 大会发布新一代多模态视频生成与编辑模型 Gemini Omni Flash；字节的 Seedance2.0、快手可灵、阿里的欢乐马也一次又一次，打破了我们的预期。

各家模型生成的画面一个比一个好看，只可惜时长大多不超过 20 秒。一旦把视频拉长到分钟级，麻烦就来了，要么是同一角色跨镜头后面目全非，要么是说着说着声音变了或没了；想改一个镜头，整条视频还得重新生成……

正因如此，AI 长视频难以真正进入专业内容生产的工作流。

最近，一项开源的新技术却向我们展示了一幅完全不同的图景。

先来看个 case。

本文转自：凤凰网科技

原文地址： https://tech.ifeng.com/c/8tjXFuvjrii

搜索一下