可灵AI 2.0 Master版再迭代:4K十分钟视频生成进入商用元年

2026-06-06

栏目:最新快讯  |  关键词:最新快讯、大模型、人工智能前沿  |  类型:客观新闻



2026年6月初,快手旗下可灵AI(Kling)团队正式推送了2.0 Master版的第三次重大迭代更新,将视频生成能力从原有的2分钟1080p直接拉升至4K分辨率、最长10分钟的连续视频生成。这一升级标志着AI视频生成技术正式跨越"片段演示"阶段,进入可支撑商业级短片、广告乃至影视剧预演制作的全新纪元。

事件背景可追溯至2025年12月。彼时,可灵AI 2.0版本首次亮相,凭借对口型、视频编辑、首尾帧控制等功能迅速积累全球用户。据官方披露,截至2026年5月底,可灵AI全球用户已突破2200万,累计生成视频数量超过1.2亿条。然而,彼时的2.0版本在时长和分辨率上仍受限于2分钟1080p,对于专业影视制作而言,仅能胜任短视频和广告片段。

本次迭代的核心理论突破在于多模态大模型架构的优化。可灵AI团队采用了全新的时空联合建模技术,将视频帧间的时序一致性损失降低了约40%,同时通过引入分层渲染机制,在保持4K分辨率的前提下,将单分钟视频的生成耗时压缩至行业平均水平的60%。据快手技术副总裁王仲远在接受《机器之心》采访时透露,2.0 Master版采用了"双引擎"架构——底层是自研的3D VAE(变分自编码器)负责空间细节重建,上层是时序Transformer负责动作连贯性,两者通过跨模态注意力机制实现协同。

核心功能方面,新版本在三个维度实现跃升。首先是分辨率与时长,4K 10分钟的规格意味着用户可以直接生成符合广播级标准的视频素材,无需传统AI视频"分段生成+后期拼接"的繁琐流程。其次是物理世界模拟的精准度,2.0 Master版在流体动力学、刚体碰撞和光影追踪方面引入了物理引擎辅助,使得生成视频中水面的波纹、衣物的褶皱、玻璃的反光的真实度显著提升。第三是多模态输入的扩展,用户现在可以输入文字脚本、参考图片、视频片段甚至3D模型作为生成条件,系统会自动理解各模态间的语义关联并生成统一风格的输出。

各方反应迅速。国内影视行业方面,华谊兄弟、光线传媒等头部公司在内部测试中已将可灵AI 2.0 Master版用于影视剧的分镜预演和概念验证,据称可将前期筹备周期缩短30%以上。国际方面,好莱坞视觉特效协会(VES)在6月初的声明中表示,正在评估此类工具对VFX工作流的影响,但强调"AI生成内容目前仍无法替代艺术家在创意决策中的核心作用"。Adobe公司则在同期宣布,其Premiere Pro软件将在下一版本中内置可灵AI的API接口,实现"一键生成+专业剪辑"的无缝衔接。

影响分析层面,4K 10分钟视频生成的商用化将直接冲击传统影视制作的成本结构。据德勤2026年Q1报告估算,一部标准网络短剧的制作成本中,拍摄和后期约占60%-70%,若AI预演和素材生成技术普及,这部分成本有望压缩20%-40%。但与此同时,行业也面临新的挑战:如何界定AI生成素材的版权归属?如何确保生成内容不侵犯肖像权和商标权?这些问题在时长延长后变得更加复杂。

未来展望,可灵AI团队已在路线图中披露了"3.0版本"的雏形,目标是实现实时交互式视频生成——即用户在观看过程中可以通过语音或手势指令改变剧情走向和画面内容。此外,随着算力成本的持续下降,预计2026年下半年将有更多厂商跟进4K长视频生成赛道,包括字节跳动的即梦AI、阿里巴巴的通义万相、以及海外的Runway、Pika等,竞争格局将进一步白热化。

信源:机器之心、量子位、TechCrunch、德勤2026年Q1报告


分享
写评论...