麻省理工学院与Hugging Face联合发布的研究指出,中国研发的人工智能模型在全球下载量上首次超过美国团队,占比达到17%,而美国模型的比例为15.8%。这一变化代表着全球AI竞争格局出现新的关键节点。推动这种增长的主要力量来自DeepSeek以及阿里巴巴的通义千问等模型,它们以更高的性价比和频繁的版本更新获得用户青睐。
中国模型使用量的迅速攀升也带来了显著的安全问题。网络安全公司CrowdStrike在11月20日公布的调查显示,当DeepSeek模型面对涉及西藏、维吾尔族或中国政府认为敏感的政治主题时,会产生更多风险性代码。在一般情况下,该模型生成易被利用代码的比例为19%,但在被要求为西藏的工业控制系统编写程序时,这一比例上升到27.2%。这些弱点似乎是在推理阶段出现,说明问题更可能与模型固有偏向有关,而不是训练数据本身的问题。
调查还指出,这些模型在内容生成方面表现出与中国官方叙事的一致性,例如拒绝输出有关台湾或天安门事件的文字。新美国安全中心研究员珍妮特·伊根强调,中国在开源模型上的快速推进“应让美国提高警惕”。
中国当前的开放策略与美国科技巨头呈现出明显对立。OpenAI、谷歌和Anthropic选择紧密封闭模型架构,通过封闭生态发展通用人工智能,并依靠订阅收费维持增长。Meta曾推动开源模型,在推出Llama后如今也为了追求更强的智能系统而逐步转向封闭路线。
与此同时,美国对先进Nvidia芯片的出口限制,促使中国企业不断加快开源步伐。开发者普遍采取更灵活的升级方式,常常以每周或半月为周期推出新版本,相比之下,美国实验室往往半年甚至一年才会发布一次更新。
美国方面在开源领域的贡献较少,艾伦人工智能研究院11月推出的Olmo 3是近期少数的代表性成果之一。投资机构Andreessen Horowitz的合伙人Martin Casado透露,如今向他们寻求投资的人工智能初创团队中,有多达80%基于中国的开源模型,凸显中国模型在行业中的影响力正在不断扩大。