商业化落地加速国产大模型激战视频生成赛道

来源：北京日报时间：2024-12-12 15:16:22

来源标题：商业化落地加速国产大模型激战视频生成赛道

12月10日，在公开预览版10个月后，OpenAI的人工智能(AI)视频生成模型Sora正式上线。

尽管发布内容十分重磅，但并未在中国市场激起巨大水花。“效果在预期之内。”北京一家科技企业负责人说，目前这一大模型实力并未强到令国内从业者恐慌，“许多功能目前国内工具也已经具备。”

在视频生成赛道激战近一年，国产视频大模型快速崛起，数十个产品对外亮相。大模型一方面在技术上不断迭代，另一方面，也正在积极探索更多的商业化空间。

国产视频大模型集中爆发

“请《甄嬛传》祺贵人吃汉堡”“容嬷嬷给紫薇喝橙汁”“小猫自己动手揉面包饺子”……近段时间以来，用AI大模型制作的各种搞笑视频走红网络。有人将经典影视剧“魔改”搞起吃播;有人让老照片“动”起来吸引大量互动;还有人生成各种AI猫咪视频粉丝迅速过万。

这背后，是国产视频大模型快速崛起，文生视频、图生视频的门槛大大降低。今年3月底，“即梦AI”平台内测，并在5月开放网页版，8月正式上架移动端。6月6日，“可灵”视频生成大模型官网正式上线，并在15天之后宣布推出图生视频功能。

互联网厂商各类视频生成大模型如雨后春笋般涌现。7月4日，商汤科技发布人物视频生成大模型Vimi;7月6日，上线AI生成视频模型清影;9月19日，阿里云通义万相发布视频生成模型，上线文生视频和图生视频功能;12月3日，腾讯混元大模型上线视频生成功能。

影视行业成率先落地场景

视频生成大模型的批量上线，最先影响的是影视行业。据OpenAI透露，自今年2月首次预告Sora以来，便开始与电影制片厂、媒体高管以及经纪公司展开会谈。

中国电影博物馆副馆长刘军告诉记者，随着视觉生成大模型技术的不断突破，AIGC(生成式人工智能)技术不仅可以实现降低视频内容制作成本、提升生产效率的双赢，更有望发展出成规模的、影视工业级的生产工具。

事实上，国产视频生成大模型在影视行业的探索已陆续有成果落地。6月28日，中央广播电视总台制作的三部AI短剧上线。博纳影业与抖音合作推出AI科幻短剧《三星堆：未来启示录》，快手也推出AI奇幻短剧《山海奇镜之劈波斩浪》;截至12月11日，两部AI短剧在所属平台播放量已分别达到5632.3万次和5269.5万次。

AIGC电影短片的出现，更是让外界看到潜力。12月6日，中国首个AIGC导演共创计划上线。“AI效率很高，实现了一条从想象到可视化的结果路径。”导演王子川说，比如当需要航拍一条跨海大桥爆破场面时，传统手段不可能马上实现;但AI却能快速给出20种可能性，“比如要怎么炸，大海是什么样，要什么样的海洋激流，汽车要哪一年代的……将想象快速影像化，一下子彻底解放了生产力。”

鉴于影视作品对品质、连贯性和艺术性的要求较高，AI生成的内容水准尚需提升。快手大模型团队负责人张迪坦言，AI技术在影视应用领域仍然处于快速发展的初级阶段：“我们希望能在未来一年时间里，让它真正成为一个成熟的创作工具。”

商业化空间有望加速打开

上半场研发大模型“造锤子”，下半场瞄准应用场景“找钉子”。各大玩家在积极探索AI视频生成的其他规模化应用场景。记者注意到，目前，AI视频生成技术已在教育、医疗、文旅及游戏等产业中落地。

新壹科技副总裁毛木子举例，如中国国家旅游杂志的“最美中轴线”影像作品集、国家大剧院的《艺·境》主题展览、通州区“运河十周年”宣传片等，都运用到了视频生成大模型技术。

业内人士认为，目前国产视频大模型在画面的一致性、可控性、丰富程度上都有明显提升，提高成像质量、突破生成时长瓶颈后，有望大幅打开下游商业化空间。

但作为多模态生成中难度最大的领域，视频生成大规模商业化仍需应对诸多挑战。腾讯混元多模态生成技术负责人凯撒向记者透露，目前视频生成大模型在运动维度、图文一致性上还需进一步提升：“比如5秒视频共有129帧，每一帧都做对是非常难的。”

毛木子进一步解释道，视频保持画面清晰度的同时，确保镜头之间平滑过渡也是一个难题。此外，AI视频生成的著作权之争也仍在被社会广泛思考、讨论，相关司法亦在探索实践中。

标签：