一場内部的人为操作失误,让 Anthropic 代号「Claude Mythos」的全新旗舰模型曝光。公司形容它是 AI 效能的「一次阶段性跨越」,同时警告其网络安全能力远超任何现有 AI 模型。
(前情提要:法官支持 Anthropic,禁止美国防部以「供应链风险标签」惩罚 Claude)
(背景补充:Anthropic AI 经济指数万字报告:自动化交易工作流频率翻倍,Claude 正从工具变生活助理)
本文目录
Toggle
不是刻意发布,而是一次人为失误?根据《Fortune》独家报道,Anthropic 因为内容管理系统(CMS)操作错误,将近 3,000 份未发布的内部文章暴露在可公开搜索的资料中。
Fortune 取得并审阅了其中的草稿博客文章,发现 Anthropic 正在开发一款代号「Claude Mythos」(或称 Capybara)的全新旗舰模型,并已悄悄对早期访问客户开放测试。
这份草稿直接写道:
这是「迄今我们开发过的、毫无疑问最强大的 AI 模型」
从架构定位来看,Claude Mythos 并非 Opus 的升级版,而是在既有层级之上新增了「Capybara」层:取代 Opus 成为 Anthropic 最高阶模型。草稿档案指出,与 Claude Opus 4.6 相比,新模型在软件程序编写、学术推理、网络安全等测试中均出现大幅提升。
Claude 目前分为三个层级:Haiku(极速便宜)、Sonnet(全能平衡)与 Opus(旗舰深思)
代价是运算成本。Anthropic 坦承这款模型「执行成本昂贵」,尚未准备好向大众全面开放。目前的策略是分阶段发布:先让早期访问伙伴试用,收集反馈后再决定是否扩大部署范围。
泄露的起因是 CMS 资产的预设权限设为公开,员工必须手动标记为私密,一旦疏漏就会直接可搜索。这次事故中,曝光的不只是模型信息:还包括员工育婴假档案、未发布的图片、PDF 与音频。Fortune 通知 Anthropic 后,访问随即被关闭。Anthropic 承认这是「人为错误」,LayerX Security 研究员 Roy Paz 与剑桥大学研究员 Alexandre Pauwels 也协助审阅验证了相关档案的真实性。
值得注意的是,草稿档案警告这类模型「预示着即将到来的一波浪潮,这些模型利用漏洞的能力将远远超出防御者的应对速度」。正因如此,Mythos 的初期发布策略聚焦于网络防御者,让他们抢先强化代码库,试图在攻守之间维持一定的缓冲窗口。
官方的担心不是多虑。Anthropic 记录了一起有据可查的案例;中国国家支持的组织早已利用 Claude Code 入侵约 30 个机构,对象涵盖科技公司、金融机构与政府机关。Anthropic 花了 10 天调查此事,最终封禁相关账户并通知受害者。这起事件发生在 Mythos 正式曝光之前,使用的是现有 Claude 工具,而非下一代模型。
竞争格局同样在移动。OpenAI 同期发布的 GPT-5.3-Codex 也被业界归类为网络安全「高能力」模型,意味着前沿 AI 的能力边界已集体跨越一道新门槛,不再是单一厂商的问题。
这批泄露档案还附带了一份商业布局的线索:Anthropic 计划在英格兰乡村一座 18 世纪庄园举办为期两天的限邀闭门峰会,邀请「欧洲最具影响力的商界领袖」,CEO Dario Amodei 将亲自出席,与会者将体验尚未对外发布的 Claude 功能」。
这场峰会的细节意外外泄,折射出 Anthropic 正在加速欧洲商业版图的渗透,而 Mythos 很可能就是那场闭门展示的核心筹码。