Runway视频AI模型夺基准测试冠军超越谷歌与OpenAI

2025-12-02

Runway推出的Gen 4.5模型在周一亮相,并在一个独立的视频生成评测榜单上夺得首位,成绩超越了科技巨头Alphabet和OpenAI的产品。这家总部位于纽约、规模约百人的新创公司在Artificial Analysis维护的Video Arena排名中占据领先,超过了位列第二的谷歌Veo 3,以及位居第七的OpenAI Sora 2 Pro。


这一文本生成视频的模型能够根据文字描述输出高质量高清视频,并展现出Runway所称的对物理规律、人体动作与镜头运动的强理解力。Video Arena采用盲评方式进行对比,参与者在不知来源的情况下为更优秀的结果投票,以保证评分的客观性。


Runway首席执行官Cristóbal Valenzuela向CNBC表示,他们故意将模型内部代号命名为“大卫”,借用经典故事的象征意义。他表示,凭借一个百人团队就能击败市值以万亿美元计的企业,说明只要高度聚焦并保持努力,就有可能实现突破。


这项成绩对Runway具有重要意义。今年4月,该公司以约30亿美元估值获得3.08亿美元融资,投资人包括英伟达、软银、富达以及General Atlantic。Runway成立于2018年,目前PitchBook给出的公司估值大约为35.5亿美元。


Gen 4.5在Artificial Analysis的基准测试中获得1,247的Elo分数。该模型将在本周内陆续开放给所有Runway用户,可通过平台、API或合作伙伴接口使用。Valenzuela透露,这次发布只是公司接下来多个大型更新中的第一步。


尽管成果显著,Runway也指出Gen 4.5仍在物体一致性与因果逻辑上存在挑战——这是当前行业内大多数视频生成模型普遍面对的难题,有时呈现出的结果会出现时间逻辑颠倒的情况。



分享
写评论...