来源标题:商业化落地 加速国产大模型激战视频生成赛道
12月10日,在公开预览版10个月后,OpenAI的人工智能(AI)视频生成模型Sora正式上线。
尽管发布内容十分重磅,但并未在中国市场激起巨大水花。“效果在预期之内。”北京一家科技企业负责人说,目前这一大模型实力并未强到令国内从业者恐慌,“许多功能目前国内工具也已经具备。”
在视频生成赛道激战近一年,国产视频大模型快速崛起,数十个产品对外亮相。大模型一方面在技术上不断迭代,另一方面,也正在积极探索更多的商业化空间。
国产视频大模型集中爆发
“请《甄嬛传》祺贵人吃汉堡”“容嬷嬷给紫薇喝橙汁”“小猫自己动手揉面包饺子”……近段时间以来,用AI大模型制作的各种搞笑视频走红网络。有人将经典影视剧“魔改”搞起吃播;有人让老照片“动”起来吸引大量互动;还有人生成各种AI猫咪视频粉丝迅速过万。
这背后,是国产视频大模型快速崛起,文生视频、图生视频的门槛大大降低。今年3月底,“即梦AI”平台内测,并在5月开放网页版,8月正式上架移动端。6月6日,“可灵”视频生成大模型官网正式上线,并在15天之后宣布推出图生视频功能。
互联网厂商各类视频生成大模型如雨后春笋般涌现。7月4日,商汤科技发布人物视频生成大模型Vimi;7月6日,上线AI生成视频模型清影;9月19日,阿里云通义万相发布视频生成模型,上线文生视频和图生视频功能;12月3日,腾讯混元大模型上线视频生成功能。
影视行业成率先落地场景
视频生成大模型的批量上线,最先影响的是影视行业。据OpenAI透露,自今年2月首次预告Sora以来,便开始与电影制片厂、媒体高管以及经纪公司展开会谈。
中国电影博物馆副馆长刘军告诉记者,随着视觉生成大模型技术的不断突破,AIGC(生成式人工智能)技术不仅可以实现降低视频内容制作成本、提升生产效率的双赢,更有望发展出成规模的、影视工业级的生产工具。
事实上,国产视频生成大模型在影视行业的探索已陆续有成果落地。6月28日,中央广播电视总台制作的三部AI短剧上线。博纳影业与抖音合作推出AI科幻短剧《三星堆:未来启示录》,快手也推出AI奇幻短剧《山海奇镜之劈波斩浪》;截至12月11日,两部AI短剧在所属平台播放量已分别达到5632.3万次和5269.5万次。
AIGC电影短片的出现,更是让外界看到潜力。12月6日,中国首个AIGC导演共创计划上线。“AI效率很高,实现了一条从想象到可视化的结果路径。”导演王子川说,比如当需要航拍一条跨海大桥爆破场面时,传统手段不可能马上实现;但AI却能快速给出20种可能性,“比如要怎么炸,大海是什么样,要什么样的海洋激流,汽车要哪一年代的……将想象快速影像化,一下子彻底解放了生产力。”
鉴于影视作品对品质、连贯性和艺术性的要求较高,AI生成的内容水准尚需提升。快手大模型团队负责人张迪坦言,AI技术在影视应用领域仍然处于快速发展的初级阶段:“我们希望能在未来一年时间里,让它真正成为一个成熟的创作工具。”
商业化空间有望加速打开
上半场研发大模型“造锤子”,下半场瞄准应用场景“找钉子”。各大玩家在积极探索AI视频生成的其他规模化应用场景。记者注意到,目前,AI视频生成技术已在教育、医疗、文旅及游戏等产业中落地。
新壹科技副总裁毛木子举例,如中国国家旅游杂志的“最美中轴线”影像作品集、国家大剧院的《艺·境》主题展览、通州区“运河十周年”宣传片等,都运用到了视频生成大模型技术。
业内人士认为,目前国产视频大模型在画面的一致性、可控性、丰富程度上都有明显提升,提高成像质量、突破生成时长瓶颈后,有望大幅打开下游商业化空间。
但作为多模态生成中难度最大的领域,视频生成大规模商业化仍需应对诸多挑战。腾讯混元多模态生成技术负责人凯撒向记者透露,目前视频生成大模型在运动维度、图文一致性上还需进一步提升:“比如5秒视频共有129帧,每一帧都做对是非常难的。”
毛木子进一步解释道,视频保持画面清晰度的同时,确保镜头之间平滑过渡也是一个难题。此外,AI视频生成的著作权之争也仍在被社会广泛思考、讨论,相关司法亦在探索实践中。
标签: