一周AI大事:Kimi万亿模型横空出世,小鹏人形机器人“以假乱真”!.docx

2025-11-11

一、重磅工具——1万亿参数Kimi“亮剑”,既能做事也会做事

新闻:月之暗面 (Moonshot AI) 宣布推出Kimi K2 Thinking,这是一款专为打造强大AI智能体而从零开始打造的开源AI推理模型。这款高效的混合专家(MoE)模型基于Kimi K2构建,总参数量达1万亿,推理时激活参数320亿,支持的长上下文可达25.6万词元。

在数学、编程和智能体基准测试中,Kimi K2 Thinking的表现可媲美GPT-5和Claude 4.5 Thinking:在Humanities Last Exam (HLE) 测试中得分44.9%,在SWE-bench验证集测试中得分71.3%,在BrowseComp (智能体搜索)测试中得分60.2%。

这款模型不仅在写作、编码和推理方面具备优异的通用能力,在智能体任务和工具调用方面表现更为出色。它能在无人干预的情况下连续调用工具200到300次,通过数百个步骤的连贯推理来解决复杂问题。Kimi K2 Thinking采用的是量化感知训练(QAT)技术,确保其量化版本不会降低输出质量。鉴于其基准测试结果是基于INT4精度得出的,这更显得模型表现尤为抢眼。

这可能是自DeepSeek R1发布以来,中国企业推出的最重要的AI模型。它再次表明,中国AI实验室正在缩小与美国顶尖AI实验室的差距。

二、AI技术与产品发布——从“算地球”到“换人脸”,大厂“炫技”停不下来

1. 新闻:艾伦人工智能研究所(AI2)推出开源的端到端“地球智能”平台OlmoEarth,旨在利用地球观测数据帮助人们深入理解地球运行机制。其中包含:

OlmoEarth基础模型:基于地球观测数据训练的小型AI模型,参数从140万到3亿不等,用于执行场景识别或图像语义分割等地理空间相关任务;OlmoEarth Studio:用于数据集建模和微调的功能;OlmoEarth Run:地球建模流程引擎;OlmoEarth Projects:经过微调的地球智能实用模型。

2. 新闻:微软将自的文生图模型MAI-Image-1整合进Bing Image Creator和Copilot。这款模型能快速生成高质量的食物、自然和现实世界场景图像,使微软摆脱对OpenAI图像生成技术的依赖。

3. 新闻:美团龙猫团队发布全模态开源模型LongCat Flash Omni,采用MoE架构,总参数量5600亿,激活参数量270亿。技术报告显示,这款模型在多模态基准测试中达到了SOTA水平。

4. 新闻:中国电动汽车公司小鹏发布IRON人形机器人(18.280,
-0.04,
-0.22%)。该公司称这款机器人“最像人”,有柔性皮肤和仿生肌肉。人形骨骼、肌肉和皮肤结构使这款机器人成为迄今最接近人类的机器人,甚至引发了有关“恐怖谷效应”和“科幻成真”的讨论。小鹏还同步发布了VLA 2.0大模型,这是一款
用于具身AI的视觉-语言-行动模型,适用于自动驾驶汽车和AI机器人。

5. 新闻:Cognition公司发布Windsurf Codemaps。这款工具由SWE-1.5和Sonnet 4.5提供支持。它能帮助开发者理解复杂的代码结构,就像为代码库打造的Notebook LM。

6. 新闻:Maya Research团队发布Maya1开源语音生成模型,参数量30亿。这款文本转语音模型在质量基准测试中攀升至开源权重语音AI模型的第二名,在全球模型中排名第二十。其演示与模型权重现已上线HuggingFace平台。

7. 新闻:谷歌在Gemini API中引入文件搜索工具(File Search Tool),提供端到端的检索增强生成(RAG)功能,为开发者简化了复杂的RAG流程。它支持内置引用、多种文件格式和强大的语义向量搜索。此外,谷歌的无代码应用构建工具Opal现已覆盖全球160多个国家和地区。

8. 新闻:Mozilla.ai发布开源接口any-llm 1.0,允许开发者将云端和本地的任意模型接入AI工作流。any-llm通过统一的API将项目逻辑与模型提供商解耦,使开发者无需重写集成代码即可自由切换模型。

9. 新闻:Higgsfield发布Recast功能,允许用户将任意视频中的角色替换为另一个角色。

10. 新闻:Sora现已登陆Android平台,让Sora 2的高级视频生成功能覆盖更多用户。但目前Android用户仍需邀请码才能使用Sora的生成功能,且仅有部分国家和地区开放。

11. 新闻:谷歌新一代图像生成模型Nano Banana 2最早或将于下周发布。前作Nano Banana因其在图像编辑方面达到SOTA水平而广受欢迎,其升级版预计将大幅提升AI辅助创作工作流的效率。

三、AI研究资讯——谷歌嫌地球电费贵,准备玩“算力上天”

新闻:作为天基AI基础设施项目Suncatcher的组成部分,谷歌将于2027年发射两颗搭载TPU AI芯片的卫星。该项目设想未来由多颗卫星组成的太空数据中心,通过卫星间光通信链路传输数据,执行分布式AI任务。谷歌希望在未来几十年,天基数据中心的成本效益或将超过地面数据中心,因为太阳能(4.930,
0.03,
0.61%)板在轨道上的效率比地面高出8倍。

四、AI商业与政策——OpenAI豪掷千金,苹果低头付钱

1. 新闻:据报道,苹果正与谷歌达成协议,拟每年支付10亿美元,在下一代Siri语音助手中使用参数量达1.2万亿的谷歌AI模型。这意味着苹果在Siri的AI能力上再度依赖外部技术。长期未更新的Siri已让苹果在AI竞赛中明显落后。

2. 新闻:OpenAI发布《青少年安全蓝图》,旨在指导AI产品和政策如何保护青少年安全以及如何更好地为青少年赋能。该蓝图强调适龄设计、有效的安全机制,以及持续的研究和评估。OpenAI表示,公司正积极为旗下产品部署家长控制与年龄预测系统等保护机制,而不是被动等待有关AI如何保护青少年的监管规定。

3. 新闻:OpenAI与亚马逊宣布达成总额380亿美元的协议。OpenAI将在AWS基础设施上运行模型,以获取对数十万块英伟达芯片的访问权。这一举措进一步强化了OpenAI的算力与云端部署能力,从而更好地支撑ChatGPT的推理和训练。

4. 新闻:OpenAI宣布全球已经有100万家企业正在直接使用其公司服务。该公告介绍称,统计口径包括所有主动为商业用途付费的组织,以及通过开发者平台直接消费模型的企业。该公司此前在9月初曾披露,包含ChatGPT企业用户和校园版ChatGPT Edu的用户数量破百万。

5. 新闻:周三,英伟达CEO黄仁勋在接受采访时称,“中国将赢得人工智能竞赛”,理由是更有利的监管环境和更低的能源成本。这被视为黄仁勋迄今为止对中美AI竞赛作出的“最直白的表态”。

6. 新闻:黄仁勋本周末再度访问台积电,亲赴芯片产线并罕见出席台积电职工运动会。这也是黄仁勋近3个月来第3次访问台积电。对于此次访问的目的,黄仁勋表示其公司最先进的Blackwell芯片正面临“非常强劲的需求”,因此对台积电晶圆的需求也在增长。他说道:“英伟达制造GPU,我们也制造CPU、网络设备、交换机,所以有很多与Blackwell相关的芯片。而且公司也正在努力研发下一代Rubin芯片。”台积电CEO魏哲家则直白地表示“黄仁勋想要更多芯片”,但被问及具体数量时,魏哲家笑称“这是机密!”

7. 新闻:全球首个AI大模型实时投资比赛“Alpha Arena”落下帷幕。历时17天,阿里通义千问Qwen以超20%的收益率夺冠,Qwen和DeepSeek两款中国模型也成为唯二盈利的模型,而美国四大顶尖模型全部亏损,GPT-5亏损超60%垫底。

8. 新闻:Perplexity表示,亚马逊发出法律威胁,试图阻止Comet AI助手在亚马逊平台购物。Perplexity指责这是“霸凌”,认为亚马逊是想通过控制AI购物智能体来实现平台利润最大化。相比之下,Shopify正积极迎合AI智能体在电商购物领域的新角色。Shopify表示,自今年1月份以来,AI流量增长了7倍,AI下的订单增长了11倍。Shopify已经在与Perplexity和微软合作开发聊天内购物体验,并与OpenAI合作深度集成ChatGPT。

9. 新闻:Anthropic宣布在巴黎和慕尼黑新设办事处,加速扩张全球业务。欧洲是Anthropic增长最快的地区,Claude AI让该公司的欧洲营收同比增长逾9倍。Anthropic的目标是2026年实现200亿至260亿美元的年化经常性收入。

10. 新闻:美联社宣布推出结构化数据产品AP Intelligence,将经过核实的新闻报道转化为可用于AI和数据分析的行业数据集与信息源。

11. 新闻:面对来自大型科技公司的压力以及与美国在贸易问题上的磋商,欧盟委员会考虑暂停实施《AI法案》的部分条款。尽管法案已于2024年8月正式生效,但某些条款的实施时间可能会推迟。

五、AI观点与文章——卡戴珊考试挂科怪AI,“码农”编程全靠“感觉”了

1. 新闻:在接受《名利场》(Vanity Fair)采访时,美国网红金·卡戴珊 (Kim Kardashian) 谈到ChatGPT对于她可谓“亦敌亦友”。她表示因使用ChatGPT获取法律建议,自己未能通过美国司法考试,并指责模型“幻觉”生成的错误信息导致失分。这再次引发公众对大语言模型生成虚假答案、造成现实后果的关注。

2. 新闻:《柯林斯词典》2025年度热词为“氛围编程”(vibe coding),意指使用自然语言提示词来让AI编写代码或生成应用程序。AI不仅在改变世界,也在改变语言本身。



分享
写评论...