logo

上周 Anthropic 的 Claude Code 源码泄露还没凉透,更大的瓜来了——一个 10 万亿参数的超级模型被意外曝光。与此同时,OpenAI 的 GPT-5.4 在桌面操作任务上第一次干过了人类专家,而图灵奖得主 LeCun 拿了 10 亿美金要证明整个 LLM 路线都走错了。

---

1. Claude Mythos:Anthropic 的 10 万亿参数超级模型意外曝光

Anthropic Claude Mythos 万亿参数AI模型泄露

一句话: Anthropic 内部泄露的草案揭示了 Claude Mythos——一个 10 万亿参数的超级模型,被 Anthropic 自己称为"能力阶跃式提升",且存在"前所未有的网络安全风险"。

3 月 26 日,Fortune 独家报道了 Anthropic 一个未受保护的公开数据存储中发现的内部文档。文档显示,Anthropic 正在测试一个名为 Claude Mythos(内部代号 Capybara)的新模型,参数规模达到 10 万亿——这是已知最大的 AI 模型,比 GPT-5.4 大一个数量级。

Mythos 在 Anthropic 的模型层级中占据一个全新位置:Haiku → Sonnet → Opus → Mythos。它不是 Opus 的迭代,而是一个全新的能力层级。Anthropic 发言人承认该模型代表"阶跃式能力提升(step change)",是"我们迄今构建的最强模型"。

但真正让行业紧张的是安全评估。泄露文档直接说这个模型"构成前所未有的网络安全风险"。Anthropic 采取了极其保守的分阶段发布策略,目前仅对极少数早期客户开放。Euronews 的跟进报道确认了安全顾虑是推迟公开发布的主要原因。

这件事的时间线很有意思:3 月 31 日 Claude Code 源码泄露,而 3 月 26 日 Mythos 文档泄露——Anthropic 在一周内经历了两次重大信息安全事件。对于一家把"负责任 AI"写进使命的公司来说,这不是好看的成绩单。

对开发者的影响: 短期内你用不到 Mythos,但它的存在意味着模型能力的天花板还远没到。更值得关注的是:如果一个模型强到开发者自己都觉得有网络安全风险,那部署它的企业需要什么级别的安全基础设施?这可能催生一波 AI 安全工具的需求。

> 来源: Fortune | Euronews | InvestorPlace

---

2. GPT-5.4 在 OSWorld 超越人类专家:AI Agent 进入超人时代

OpenAI GPT-5.4 超越人类基准 AI Agent

一句话: OpenAI GPT-5.4 在 OSWorld 桌面自主操作基准测试中达到 75.0%,首次超过人类专家的 72.4%,标志着 AI Agent 在真实计算机操作中进入超人水平。

3 月 5 日发布的 GPT-5.4 刷新了一系列核心基准。但真正让人坐不住的是 OSWorld-Verified 的成绩:75.0%。这个测试衡量的是模型在真实桌面环境中通过截图识别 + 键鼠操作来完成任务的能力——打开应用、填表单、操作文件系统、用浏览器完成多步流程。GPT-5.2 只有 47.3%,一代之间跳了 28 个点。

其他关键数字:

  • GDPval(知识工作): 83%,创纪录
  • SWE-bench Pro(编程): 57.7%
  • APEX-Agents(法律/金融专业技能): 行业第一
  • 上下文窗口: 1M tokens

GPT-5.4 还带来了 Pro 版和 Thinking 版两个变体。Pro 版针对企业工作流优化(更快、更稳定),Thinking 版针对复杂推理任务(更慢但更准确)。

超越人类基准意味着什么?不是说 AI 在所有桌面任务上都比人强——OSWorld 测的是特定的、结构化的操作序列。但它意味着:对于重复性的、有明确步骤的计算机操作工作,AI Agent 已经可以比一般人做得更好更快。RPA(机器人流程自动化)行业应该开始紧张了。

对开发者的影响: 如果你在构建基于 Computer Use 的 AI Agent 产品,GPT-5.4 是目前的性能天花板。但注意 Anthropic Claude 的 Computer Use API 在稳定性和可控性上仍有优势。关键问题不再是"AI 能不能操作电脑",而是"怎么安全地让 AI 操作电脑"。

> 来源: OpenAI | TechCrunch | OpenAI Tools Hub

---

3. Yann LeCun 的 AMI Labs:$10.3 亿赌注要证明 LLM 路线走错了

Yann LeCun AMI Labs 世界模型 AI 融资

一句话: 图灵奖得主 Yann LeCun 离开 Meta 后创立的 AMI Labs 完成 $10.3 亿种子轮融资,估值 $35 亿,要用"世界模型"颠覆当前 LLM 主导的 AI 路线。

这是欧洲历史上最大的种子轮,也可能是全球最大的。3 月 10 日,AMI(Advanced Machine Intelligence)Labs 宣布完成融资,投资方阵容堪称"全明星":Bezos Expeditions、Nvidia、Eric Schmidt、Mark Cuban、Tim Berners-Lee,还有 Cathay Innovation、Greycroft 等一线 VC 联合领投。

LeCun 的核心论点很简单:文本预测有根本性的局限。LLM 只是在预测下一个 token,它永远不会真正"理解"物理世界。他的替代方案是 JEPA(Joint Embedding Predictive Architecture)——不预测像素或文字,而是在抽象表示空间中预测未来状态。通俗地说:不教 AI 读书写字,而是教它建立对世界的物理直觉。

这不是学术之争。如果 LeCun 是对的,那 OpenAI、Anthropic、Google 在 LLM 上烧掉的几千亿美金就是在一条死胡同里狂奔。如果他是错的,10 亿美金就是一堂昂贵的课。

AMI Labs 由 Alexandre LeBrun(前 Nabla 创始人)任 CEO 负责日常运营,LeCun 本人担任首席科学家。公司从成立到融资完成仅用了 4 个月。

对开发者的影响: 短期内这不会改变你的技术栈。但 JEPA 和世界模型的思路值得关注——特别是如果你在做机器人、自动驾驶、或任何涉及物理环境理解的 AI 应用。LeCun 的赌注是:下一代突破不在语言模型,而在能理解物理规律的 AI。

> 来源: TechCrunch | Sifted | Crunchbase News

---

4. OpenAI 年化收入 $25B,IPO 最早 2026 年底

OpenAI IPO 上市计划 年化收入250亿美元

一句话: OpenAI 年化收入突破 $250 亿,Q1 融了 $1220 亿创纪录,据报道最早 2026 年底启动 IPO,估值 $8520 亿。

把几个数字放一起看:$25B 年化收入、$122B 单轮融资、$852B 估值。OpenAI 正在以史无前例的速度从 AI 实验室变成一个超级商业体。作为对比,Google 2024 年全年广告收入约 $265B,而 OpenAI 才成立 9 年。

$122B 的融资轮本身就是商业史上的奇迹:Amazon 出 $500 亿、Nvidia 和 SoftBank 各出 $300 亿。这笔钱的用途很明确——训练下一代模型的算力采购、全球数据中心扩张、以及支撑 OpenAI 从 API 公司向全栈 AI 平台的转型。

IPO 传闻在 Q1 就开始流传了。路透社和 The Information 都报道 OpenAI 正在与投行进行初步接触,最早时间窗口是 2026 年 Q4。如果成真,这将是自 2012 年 Facebook IPO 以来科技行业最大的上市事件。

但风险也很明显:烧钱速度惊人(据估计年运营成本超 $10B)、与 Anthropic 和 Google 的竞争白热化、监管环境不确定、以及核心技术(大模型训练)的成本曲线是否可持续。

对开发者的影响: OpenAI IPO 对开发者的最直接影响是定价策略。上市公司需要向投资者展示利润增长路径,这意味着现在的低价 API 和慷慨的免费 tier 可能不会永远持续。如果你的产品重度依赖 OpenAI API,开始认真评估多模型策略。

> 来源: Crunchbase | Axios

---

5. NVIDIA 发布物理 AI 模型:具身智能从实验室走向工厂

NVIDIA 物理AI模型 机器人 具身智能

一句话: NVIDIA 发布全新物理 AI 模型套件,全球合作伙伴同步展示新一代机器人,从仿真训练到真实部署的闭环正在形成。

NVIDIA 不只是卖 GPU 的了。最新发布的物理 AI 模型套件覆盖了机器人开发的全链路:感知(3D 场景理解)、规划(任务分解和路径规划)、控制(精细动作执行)。这些模型可以在 NVIDIA Isaac 平台上进行仿真训练,然后直接部署到实体机器人上。

全球合作伙伴的同步展示说明了落地进度:工业机械臂在做精密装配、仓储机器人在做分拣、人形机器人在做简单的家务操作。虽然离科幻电影还很远,但从"PPT 机器人"到"能干活的机器人"的跨越正在发生。

这与 LeCun 的 AMI Labs 形成有趣的呼应——两者都在押注 AI 的下一个战场是物理世界。不同的是,NVIDIA 走的是工程落地路线(先让现有模型+机器人能用),LeCun 走的是基础研究路线(先搞清楚世界模型的正确架构)。

工信部 1 月发布的《"人工智能+制造"专项行动》明确提出 2027 年前推出 1000 个工业智能体,这对 NVIDIA 的中国业务是明确利好——尽管芯片出口限制仍是变量。

对开发者的影响: 如果你对机器人或具身 AI 感兴趣,NVIDIA Isaac 平台是目前最成熟的入门路径。不需要实体机器人,在仿真环境里就能开始开发和测试。关注 JR Academy 的 AI 学习路线图 了解具身智能方向的技能需求。

> 来源: NVIDIA Blog | 36氪

---

编辑小结

本周 AI 行业的主题词是"边界突破"——模型规模的边界(Mythos 10 万亿参数)、能力的边界(GPT-5.4 超越人类)、范式的边界(LeCun 挑战 LLM)、商业的边界(OpenAI 冲 IPO)、物理的边界(NVIDIA 具身 AI)。

实操建议: 1. 关注 Claude Mythos 发布节奏 — 如果你在做 AI 安全相关工作,这个模型的安全评估报告值得研究 2. 试试 GPT-5.4 的 Computer Use 能力 — 特别是 Pro 版在企业流程自动化场景的表现 3. 了解 JEPA 架构 — LeCun 的论文 A Path Towards Autonomous Machine Intelligence 是最佳入门材料 4. 评估多模型策略 — OpenAI IPO 后定价可能调整,现在就开始测试 Gemma 4、Claude、Llama 作为备选

想系统学习 AI 开发?看看 JR Academy 的课程,从基础到 Agent 开发全覆盖。

JR Academy · Blog职业洞察

AI 日报 2026-04-06:Claude Mythos 万亿参数模型曝光,GPT-5.4 首次超越人类基准

今日 AI 五大热点:Anthropic Claude Mythos 10万亿参数模型泄露、GPT-5.4 桌面任务超越人类、Yann LeCun AMI Labs 欧洲最大种子轮、OpenAI 冲刺IPO、NVIDIA 物理AI模型发布

发布日期
阅读时长2 分钟
作者

上周 Anthropic 的 Claude Code 源码泄露还没凉透,更大的瓜来了——一个 10 万亿参数的超级模型被意外曝光。与此同时,OpenAI 的 GPT-5.4 在桌面操作任务上第一次干过了人类专家,而图灵奖得主 LeCun 拿了 10 亿美金要证明整个 LLM 路线都走错了。

---

1. Claude Mythos:Anthropic 的 10 万亿参数超级模型意外曝光

Anthropic Claude Mythos 万亿参数AI模型泄露

一句话: Anthropic 内部泄露的草案揭示了 Claude Mythos——一个 10 万亿参数的超级模型,被 Anthropic 自己称为"能力阶跃式提升",且存在"前所未有的网络安全风险"。

3 月 26 日,Fortune 独家报道了 Anthropic 一个未受保护的公开数据存储中发现的内部文档。文档显示,Anthropic 正在测试一个名为 Claude Mythos(内部代号 Capybara)的新模型,参数规模达到 10 万亿——这是已知最大的 AI 模型,比 GPT-5.4 大一个数量级。

Mythos 在 Anthropic 的模型层级中占据一个全新位置:Haiku → Sonnet → Opus → Mythos。它不是 Opus 的迭代,而是一个全新的能力层级。Anthropic 发言人承认该模型代表"阶跃式能力提升(step change)",是"我们迄今构建的最强模型"。

但真正让行业紧张的是安全评估。泄露文档直接说这个模型"构成前所未有的网络安全风险"。Anthropic 采取了极其保守的分阶段发布策略,目前仅对极少数早期客户开放。Euronews 的跟进报道确认了安全顾虑是推迟公开发布的主要原因。

这件事的时间线很有意思:3 月 31 日 Claude Code 源码泄露,而 3 月 26 日 Mythos 文档泄露——Anthropic 在一周内经历了两次重大信息安全事件。对于一家把"负责任 AI"写进使命的公司来说,这不是好看的成绩单。

对开发者的影响: 短期内你用不到 Mythos,但它的存在意味着模型能力的天花板还远没到。更值得关注的是:如果一个模型强到开发者自己都觉得有网络安全风险,那部署它的企业需要什么级别的安全基础设施?这可能催生一波 AI 安全工具的需求。

> 来源: Fortune | Euronews | InvestorPlace

---

2. GPT-5.4 在 OSWorld 超越人类专家:AI Agent 进入超人时代

OpenAI GPT-5.4 超越人类基准 AI Agent

一句话: OpenAI GPT-5.4 在 OSWorld 桌面自主操作基准测试中达到 75.0%,首次超过人类专家的 72.4%,标志着 AI Agent 在真实计算机操作中进入超人水平。

3 月 5 日发布的 GPT-5.4 刷新了一系列核心基准。但真正让人坐不住的是 OSWorld-Verified 的成绩:75.0%。这个测试衡量的是模型在真实桌面环境中通过截图识别 + 键鼠操作来完成任务的能力——打开应用、填表单、操作文件系统、用浏览器完成多步流程。GPT-5.2 只有 47.3%,一代之间跳了 28 个点。

其他关键数字:

  • GDPval(知识工作): 83%,创纪录
  • SWE-bench Pro(编程): 57.7%
  • APEX-Agents(法律/金融专业技能): 行业第一
  • 上下文窗口: 1M tokens

GPT-5.4 还带来了 Pro 版和 Thinking 版两个变体。Pro 版针对企业工作流优化(更快、更稳定),Thinking 版针对复杂推理任务(更慢但更准确)。

超越人类基准意味着什么?不是说 AI 在所有桌面任务上都比人强——OSWorld 测的是特定的、结构化的操作序列。但它意味着:对于重复性的、有明确步骤的计算机操作工作,AI Agent 已经可以比一般人做得更好更快。RPA(机器人流程自动化)行业应该开始紧张了。

对开发者的影响: 如果你在构建基于 Computer Use 的 AI Agent 产品,GPT-5.4 是目前的性能天花板。但注意 Anthropic Claude 的 Computer Use API 在稳定性和可控性上仍有优势。关键问题不再是"AI 能不能操作电脑",而是"怎么安全地让 AI 操作电脑"。

> 来源: OpenAI | TechCrunch | OpenAI Tools Hub

---

3. Yann LeCun 的 AMI Labs:$10.3 亿赌注要证明 LLM 路线走错了

Yann LeCun AMI Labs 世界模型 AI 融资

一句话: 图灵奖得主 Yann LeCun 离开 Meta 后创立的 AMI Labs 完成 $10.3 亿种子轮融资,估值 $35 亿,要用"世界模型"颠覆当前 LLM 主导的 AI 路线。

这是欧洲历史上最大的种子轮,也可能是全球最大的。3 月 10 日,AMI(Advanced Machine Intelligence)Labs 宣布完成融资,投资方阵容堪称"全明星":Bezos Expeditions、Nvidia、Eric Schmidt、Mark Cuban、Tim Berners-Lee,还有 Cathay Innovation、Greycroft 等一线 VC 联合领投。

LeCun 的核心论点很简单:文本预测有根本性的局限。LLM 只是在预测下一个 token,它永远不会真正"理解"物理世界。他的替代方案是 JEPA(Joint Embedding Predictive Architecture)——不预测像素或文字,而是在抽象表示空间中预测未来状态。通俗地说:不教 AI 读书写字,而是教它建立对世界的物理直觉。

这不是学术之争。如果 LeCun 是对的,那 OpenAI、Anthropic、Google 在 LLM 上烧掉的几千亿美金就是在一条死胡同里狂奔。如果他是错的,10 亿美金就是一堂昂贵的课。

AMI Labs 由 Alexandre LeBrun(前 Nabla 创始人)任 CEO 负责日常运营,LeCun 本人担任首席科学家。公司从成立到融资完成仅用了 4 个月。

对开发者的影响: 短期内这不会改变你的技术栈。但 JEPA 和世界模型的思路值得关注——特别是如果你在做机器人、自动驾驶、或任何涉及物理环境理解的 AI 应用。LeCun 的赌注是:下一代突破不在语言模型,而在能理解物理规律的 AI。

> 来源: TechCrunch | Sifted | Crunchbase News

---

4. OpenAI 年化收入 $25B,IPO 最早 2026 年底

OpenAI IPO 上市计划 年化收入250亿美元

一句话: OpenAI 年化收入突破 $250 亿,Q1 融了 $1220 亿创纪录,据报道最早 2026 年底启动 IPO,估值 $8520 亿。

把几个数字放一起看:$25B 年化收入、$122B 单轮融资、$852B 估值。OpenAI 正在以史无前例的速度从 AI 实验室变成一个超级商业体。作为对比,Google 2024 年全年广告收入约 $265B,而 OpenAI 才成立 9 年。

$122B 的融资轮本身就是商业史上的奇迹:Amazon 出 $500 亿、Nvidia 和 SoftBank 各出 $300 亿。这笔钱的用途很明确——训练下一代模型的算力采购、全球数据中心扩张、以及支撑 OpenAI 从 API 公司向全栈 AI 平台的转型。

IPO 传闻在 Q1 就开始流传了。路透社和 The Information 都报道 OpenAI 正在与投行进行初步接触,最早时间窗口是 2026 年 Q4。如果成真,这将是自 2012 年 Facebook IPO 以来科技行业最大的上市事件。

但风险也很明显:烧钱速度惊人(据估计年运营成本超 $10B)、与 Anthropic 和 Google 的竞争白热化、监管环境不确定、以及核心技术(大模型训练)的成本曲线是否可持续。

对开发者的影响: OpenAI IPO 对开发者的最直接影响是定价策略。上市公司需要向投资者展示利润增长路径,这意味着现在的低价 API 和慷慨的免费 tier 可能不会永远持续。如果你的产品重度依赖 OpenAI API,开始认真评估多模型策略。

> 来源: Crunchbase | Axios

---

5. NVIDIA 发布物理 AI 模型:具身智能从实验室走向工厂

NVIDIA 物理AI模型 机器人 具身智能

一句话: NVIDIA 发布全新物理 AI 模型套件,全球合作伙伴同步展示新一代机器人,从仿真训练到真实部署的闭环正在形成。

NVIDIA 不只是卖 GPU 的了。最新发布的物理 AI 模型套件覆盖了机器人开发的全链路:感知(3D 场景理解)、规划(任务分解和路径规划)、控制(精细动作执行)。这些模型可以在 NVIDIA Isaac 平台上进行仿真训练,然后直接部署到实体机器人上。

全球合作伙伴的同步展示说明了落地进度:工业机械臂在做精密装配、仓储机器人在做分拣、人形机器人在做简单的家务操作。虽然离科幻电影还很远,但从"PPT 机器人"到"能干活的机器人"的跨越正在发生。

这与 LeCun 的 AMI Labs 形成有趣的呼应——两者都在押注 AI 的下一个战场是物理世界。不同的是,NVIDIA 走的是工程落地路线(先让现有模型+机器人能用),LeCun 走的是基础研究路线(先搞清楚世界模型的正确架构)。

工信部 1 月发布的《"人工智能+制造"专项行动》明确提出 2027 年前推出 1000 个工业智能体,这对 NVIDIA 的中国业务是明确利好——尽管芯片出口限制仍是变量。

对开发者的影响: 如果你对机器人或具身 AI 感兴趣,NVIDIA Isaac 平台是目前最成熟的入门路径。不需要实体机器人,在仿真环境里就能开始开发和测试。关注 JR Academy 的 AI 学习路线图 了解具身智能方向的技能需求。

> 来源: NVIDIA Blog | 36氪

---

编辑小结

本周 AI 行业的主题词是"边界突破"——模型规模的边界(Mythos 10 万亿参数)、能力的边界(GPT-5.4 超越人类)、范式的边界(LeCun 挑战 LLM)、商业的边界(OpenAI 冲 IPO)、物理的边界(NVIDIA 具身 AI)。

实操建议: 1. 关注 Claude Mythos 发布节奏 — 如果你在做 AI 安全相关工作,这个模型的安全评估报告值得研究 2. 试试 GPT-5.4 的 Computer Use 能力 — 特别是 Pro 版在企业流程自动化场景的表现 3. 了解 JEPA 架构 — LeCun 的论文 A Path Towards Autonomous Machine Intelligence 是最佳入门材料 4. 评估多模型策略 — OpenAI IPO 后定价可能调整,现在就开始测试 Gemma 4、Claude、Llama 作为备选

想系统学习 AI 开发?看看 JR Academy 的课程,从基础到 Agent 开发全覆盖。

作者
一键分享或复制链接

相关文章推荐

查看全部文章 →