Anthropic 的新模型太危险了？

中文العربية Deutsch English Español Français हिन्दी Bahasa Indonesia 日本語 한국어 Português Русский

MMaximilian Schwarzmüller

Computing/SoftwareBusiness NewsInternet Technology

Transcript

00:00:00作为一名软件开发人员，我想通常作为一个普通人，但尤其是作为一名软件开发人员

00:00:06目前都无法避开 Anthropic。无论你是否愿意。而且我不认为你应该尝试

00:00:12忽视它，因为它非常重要。我想说，它关系到我们作为软件开发人员的未来。

00:00:20在这一集中，我不会讨论上周发生的 Claude 代码泄露事件。我不会讨论

00:00:28关于其订阅产品（如 Claude Max 等）的使用条款加强限制，

00:00:36以及他们如何打击未经授权使用这些订阅的行为。他们现在就在这样做

00:00:43因为当然，他们的订阅产品就像 OpenAI 的产品一样，都受到了高额补贴

00:00:50如果每个人都把订阅额度用满，他们就赚不到钱。所以，是的，他们真的在

00:00:56限制，或者说他们正试图将订阅的使用限制为仅限人类，且仅在其

00:01:04网站、Claude Code 或 Claude 桌面应用中使用。但再说一次，这并非本文重点

00:01:11我也不会重点关注他们令人印象深刻的收入增长，尽管这值得稍微提一下

00:01:19因为 Anthropic 的年度经常性收入已达到 300 亿美元，这已经非常

00:01:27惊人了，特别是如果将其与 2025 年底的 90 亿美元相比。也就是说

00:01:35他们在短短几个月内就将年度经常性收入翻了三倍多。这

00:01:41确实令人印象深刻。因此，当然，如果你想学习如何高效使用 Claude Code，

00:01:47如何充分发挥其潜力，我有一门相关课程，它非常受欢迎，这当然

00:01:53让我很开心，如果你想加入并学习如何高效使用

00:01:59Claude Code，可以在下方找到链接。但正如我提到的，这甚至不是今天的主题。

00:02:05相反，我想谈谈 Project Glasswing 以及他们的新模型 Mythos，他们还没有向公众发布

00:02:14他们也分享了原因。我认为理解这一点很重要，同样重要的是尝试

00:02:20看清其背后的逻辑，以及这个新模型、其运作方式及功能对我们开发者的影响。

00:02:27那么什么是 Project Glasswing？他们的新模型到底是关于什么的？

00:02:33当然，你也可以在下方找到这篇文章的链接。这是 Anthropic 官方网站上的一篇文章

00:02:39他们在那里宣布了 Project Glasswing 并讨论了他们的新模型。

00:02:44如果我向下滚动一点，我们已经可以看到一些总结性的基准测试统计数据，

00:02:52我们可以看到这个新模型，即 Mythos 的预览版，其表现

00:02:59远优于 Opus 4.6。根据你所查看的具体基准测试，

00:03:07Opus 4.6 与这个新模型之间存在着巨大的差异。当然，这本身并不是

00:03:15超级令人震撼。每当有新模型发布时，无论是哪家公司，它的表现都会远好于

00:03:21或者至少比所有竞品好那么一点点，否则它就不会被发布。而且，

00:03:26当然，有些方法可以操控这些基准测试数据，所以我通常不太在意

00:03:31这些基准测试数值，对于这个模型也不例外，但是

00:03:39关于新的 Mythos 模型，有一些有趣的事情。那就是 Anthropic 决定不

00:03:46向公众发布它，因为正如他们所说，它在发现和利用漏洞方面表现得太出色了，

00:03:56无论是操作系统、任何其他软件、浏览器，总之就是在软件领域。在这篇文章中，

00:04:05以及另一篇同样链接在下方的文章中，他们分享了一些细节，尤其是

00:04:11另一篇文章篇幅极长，提供了这个新模型发现的漏洞和

00:04:19潜在攻击方式的具体案例。例如，他们在文章开头提到一个

00:04:28非常严重的漏洞和利用方式，是在 OpenBSD 中发现的。OpenBSD 当然是一个

00:04:38在某些网络软件件中很受欢迎的操作系统，而 Mythos，他们的新模型

00:04:45运行在像 Claude Code 这样的智能体框架中，能够发现并利用——这就是

00:04:53有趣的部分——一个与整数溢出和内存访问相关的漏洞，即非预期的

00:05:02内存访问，它能够以可重现的方式使运行 OpenBSD 的机器崩溃，

00:05:12这当然可以被用来进行极具破坏性的拒绝服务攻击，通过反复发送

00:05:20特定的数据包和请求给这些机器，利用该漏洞使

00:05:27这些机器瘫痪，并可能使整个企业网络瘫痪。而这个漏洞

00:05:34是在一次成本不到 50 美元的运行中检测到的，尽管整个运行集的成本不到

00:05:43两万美元。由于你当然无法预先知道哪次运行会发现漏洞，

00:05:48所以那个（总运行）数字才是关键。尽管如此，当然很容易想象，一个能够

00:05:57以如此相对较低的成本发现此类关键漏洞的模型，取决于你是谁，

00:06:04如果你是一个国家，或者某个严重的恶意行为者，那点钱对你来说可能根本不算什么，

00:06:13这当然是个问题。因为很容易想象，如果这样的模型是由

00:06:22一家不太关心安全，或者可能不需要

00:06:31担心滥用此类漏洞所带来的任何后果的公司或组织开发的，那么这可能会成为一个问题，

00:06:42我们似乎正随着这些 AI 模型进入一个 AI 的新时代，在这个时代没有什么东西是安全的，

00:06:56而且大规模部署运行此类模型的 AI 智能体来扫描各种

00:07:05软件并发现甚至潜在利用漏洞，变得比以往任何时候都容易。当然，作为一个人类个体，

00:07:13你根本无法跟上它的步伐。我是说，这里发现的漏洞、利用方式已经存在了

00:07:19我记得他们说是 27 年左右，这表明在这么长的一段时间内，没有任何人类能够

00:07:29发现这个漏洞，包括那些过去同样有兴趣攻击这个操作系统的恶意行为者。

00:07:35这仅仅是这个新模型发现的最显著的一个案例，

00:07:41他们还列出了该模型发现并有时能够滥用的更多漏洞和利用方式，

00:07:49他们还在 X 上分享了其他故事，比如模型能够逃逸沙箱，

00:07:57或者运行该模型的 AI 智能体能够从其运行的沙箱中逃逸，

00:08:04这让我们回到了 Project Glasswing。这是一个由 Anthropic 与

00:08:11其他大公司如 AWS、苹果、微软、Linux 基金会等共同创建的倡议，

00:08:21旨在利用这个模型在正式发布以及公众接触到这个模型之前，

00:08:30基本上先修补好他们的软件。这就是这篇文章的叙述，

00:08:38是 Anthropic 的解释。而我的想法有些复杂。首先，

00:08:48我没有充分的理由认为这不是真的。显然，除了他们提到的原因外，

00:08:56Anthropic 还有一些理由不发布这个模型。例如，

00:09:04我读到这个模型大约有 10 万亿参数，这比我们目前

00:09:11能公开使用的所有前沿模型都要大得多。据称其训练成本

00:09:20约为 100 亿美元。我读到这个模型的 Token 成本预计在这个范围内：

00:09:30输入和输出 Token 分别为 25 美元和 125 美元。这当然也是不

00:09:39发布该模型的原因，因为他们无法将其包含在 Claude 订阅中，因为它实在

00:09:46太贵了。他们可能不得不将订阅价格提高到没多少人愿意支付的水平，

00:09:52因此确实没有办法将其向公众开放，至少作为 Claude Code 的一部分是行不通的。

00:09:59当然，他们仍然可以通过其 API 按使用量计费的方式来开放。如果它很贵，

00:10:05谁在乎呢？如果有公司或个人愿意付费，他们就可以这样做。这当然就是

00:10:12网络安全担忧真正发挥作用的地方。因为显然，这一切很可能不是捏造的，我是说

00:10:18这绝对不是捏造。例如这里列出的 FFmpeg 团队，他们

00:10:26能够发现 FFmpeg 中的一个漏洞。FFmpeg 团队在 X 上确认

00:10:36Anthropic 发送了一个针对 FFmpeg 软件程序的漏洞补丁。

00:10:44所以，是的，这显然不是捏造的。这些担忧是合理的，网络安全担忧是合理的，

00:10:55尤其是当然，如果资金不是主要问题，你可以部署数千个智能体同时运行，

00:11:03使用这个或我们未来可能拥有的类似模型来扫描各种软件并利用它们。

00:11:11当然，最大的问题是，利用这个模型去发现漏洞并修补它们是可行的，

00:11:19但只有当某款软件的所有者或维护者能负担得起这个模型，

00:11:30或者能免费获得使用权等情况下才可行。而且，即使漏洞被修复了，

00:11:37我们也都知道，并非世界上所有的电脑、所有的机器、所有的用户都在运行

00:11:46最新的软件。如果你去看看运行在万维网上的所有各种服务器，

00:11:55我猜绝大多数都在运行过时的软件。我是说，在我们的手机或

00:12:04笔记本电脑上，我们经常没有运行最新的软件，最新的操作系统版本，

00:12:12最新的安全补丁可能没有安装。这在软件的各个层面都是如此。而在一个

00:12:20发现安全漏洞比以往任何时候都容易的世界里，这当然会变成一个

00:12:28更大的问题。因为当然，这个 AI 模型的好处在于它也可以被用于

00:12:34主动寻找安全漏洞并进行修补，所以它不仅仅是攻击者的工具。

00:12:43它也可以让防御变得更容易，因为你现在有了一个可以同时在成千上万个

00:12:48智能体上并行运行的工具，理论上可以让你的软件更安全。这可以成为一个

00:12:56非常实用的防御工具。但当然，再次强调，并非每一家开发

00:13:01关键软件的公司或个人都能负担得起它，或者有兴趣使用它。而且即使它被用来

00:13:09发现并修补了漏洞，这些最新版本仍然不会在所有地方都被安装，

00:13:16这当然给了攻击者一个绝佳的机会窗口，他们知道比以前多得多的

00:13:23漏洞，因为有更多的漏洞被检测出来了，但并不是

00:13:31每一台机器、每一个用户都针对这些漏洞受到了保护。这是我对这一进展

00:13:39产生的一个真正的担忧。现在，这是影响到每个人、

00:13:46所有公司、最终所有人类的大局。当然另一个问题是，

00:13:52像这样的模型对我们开发者意味着什么？我是说，显然这是一个功能非常强大的模型，

00:13:59它能够独立寻找漏洞并独立利用漏洞。所以，是的，这对

00:14:08开发者的影响是什么？我认为在这一点上，目前不会有太大的改变。

00:14:16我是说，我们已经生活在一个由 AI 智能体（如 Claude Code）及其底层模型，

00:14:28当然还有 Codex 等组成的的世界里。无论你最喜欢的 AI 智能体和模型是什么，

00:14:34它们都能生成我们的大部分代码。你可能没有使用它们，你可能不喜欢它们。

00:14:39我专门做了一个视频，分享了我对此的感受，以及这如何夺走了

00:14:46软件开发部分带给我的乐趣。但无论你是否喜欢，这都是事实。

00:14:52相信我，我并不一定喜欢它。但无论如何，这就是现实。人类能做出的贡献，

00:14:57或者为什么人类在这里仍然重要，甚至可能比以往任何时候都更重要，

00:15:04当然在于你绝对不希望一个像这样的 AI 智能体失控并完全自主运作。

00:15:12引导这些模型和智能体，控制它们，给它们明确的任务，限制它们的工作范围，

00:15:21所有这些事情都比以往任何时候都重要。这些模型似乎能做的事情，

00:15:29比绝大多数开发者能做的都要多，绝对比我能做的要多。

00:15:39然而，当涉及到交付产品时，当涉及到构建供人类使用的软件时，

00:15:43人类的影响当然是极其、极其重要的。当然，正在改变的是

00:15:54我们作为软件开发者的角色。我们正在从编写代码的人转变为

00:16:01掌控模型的人，审查代码的人，理解代码

00:16:08在做什么的人，设定范围的人。是的，我再次在那段视频中谈到了这种变化，

00:16:12以及这可能并不一定是你喜欢的样子。这绝对不是

00:16:18我当初进入软件开发领域的初衷。但这就是这里的影响。而且

00:16:26这些模型的功能越强大，我认为在其中保留人类的声音就越重要，

00:16:31保留人类的影响力，从而维持这种角色的转变，维持我们

00:16:39未来的角色。但是，是的，我是说这些确实是很有趣的进展，尤其是

00:16:48这个模型及其影响，以及它具有的网络安全相关性，

00:16:58让人不禁思考，如果世界上其他的参与者、其他的国家

00:17:04或组织掌握了这个模型，或者掌握了功能相似的模型，会发生什么。

00:17:16因为当然，功能相似的模型能被公众，或者至少是被其他的国家和参与者

00:17:23获得，只是时间问题。是的，我不确定

00:17:33我们是否为网络安全领域的新竞争做好了准备。那种从漏洞被发现到被修补，

00:17:44再到人们安装这些补丁之间的延迟，我认为我们将进入一个网络安全的新时代。

00:17:52我确信我们能够适应，但这绝对标志着

00:18:00模型开发史上一个有趣的转折点，我会这么说。

Key Takeaway

Anthropic 决定不向公众发布拥有 10 万亿参数的新模型 Mythos，因为该模型能以极低成本自动发现并利用已存在数十年的系统级漏洞，这将重塑网络安全攻防效率的失衡状态。

Highlights

Anthropic 的年度经常性收入在 2026 年初已达到 300 亿美元，较 2025 年底的 90 亿美元增长了三倍以上。
新模型 Mythos 拥有约 10 万亿个参数，其训练成本约为 100 亿美元，推理成本高达每百万输入 Token 25 美元及每百万输出 Token 125 美元。
Mythos 在基准测试中表现大幅超越 Opus 4.6，在不到 50 美元的单次运行中发现了 OpenBSD 中存在 27 年之久的整数溢出与内存访问漏洞。
Anthropic 发起的 Project Glasswing 计划通过与苹果、微软、AWS 及 Linux 基金会合作，在模型公开发布前利用 AI 识别并修复核心软件漏洞。
Mythos 具备逃逸沙箱的能力，且能够通过自动化代理框架自主发现并复现导致系统崩溃的拒绝服务攻击方式。

Timeline

Anthropic 的业务增长与订阅政策调整

Anthropic 的年度经常性收入在数月内从 90 亿美元激增至 300 亿美元。
公司开始严格打击未经授权的订阅共享行为，并将 Claude 订阅的使用范围限制在官方网站、桌面应用及 Claude Code 内部。

当前的订阅模式由于包含高额补贴，导致高强度使用下公司难以盈利。因此 Anthropic 正在强化服务条款，确保订阅额度仅由人类用户在其官方生态系统内消耗。这种业务扩张反映了市场对 Claude 系列模型及相关开发工具的极高需求。

Mythos 模型的性能突破与安全威胁

Mythos 模型在寻找和利用操作系统、浏览器及各类软件漏洞方面表现出极高的自主性。
该模型在 OpenBSD 中定位了一个隐藏 27 年的严重内存漏洞，该漏洞可被用于实施极具破坏性的拒绝服务攻击。

Mythos 在智能体框架中运行时，能以不到 50 美元的成本发现复杂的整数溢出漏洞。相比之下，即使是针对该系统有强烈攻击意图的恶意行为者，在过去近三十年间也未能发现此漏洞。Anthropic 担心恶意行为者若掌握此类模型，将能以人类无法企及的速度大规模扫描并瘫痪全球企业网络。

Project Glasswing 与先发制人的防御策略

Project Glasswing 是一项联合 AWS、苹果、微软和 Linux 基金会的行业倡议，旨在发布模型前完成漏洞修复。
FFmpeg 团队已确认收到并验证了由 Anthropic 模型生成的软件安全补丁。

由于 Mythos 的推理成本极高，输入 100 万 Token 需花费 25 美元，输出则需 125 美元，这使其无法整合进普通订阅服务。目前的策略是利用模型作为防御工具，在恶意攻击者开发出同类能力前，优先协助软件维护者修补漏洞。这种协作模式证明了 AI 在网络安全防御端的实际应用价值。

网络安全新纪元的挑战与防御成本

AI 加速漏洞发现后，软件更新的延迟成为攻击者的绝佳利用窗口。
并非所有关键软件的开发者都能负担起使用 Mythos 级模型进行漏洞自查的成本。

即便 AI 能同步生成补丁，全球大量服务器仍运行着过时的系统版本。这种防御上的滞后性在 AI 驱动的自动化攻击面前变得更加危险。AI 既可以成为成千上万个并行运作的防御代理，也可能因为资源分配不均而加剧安全性差距。

软件开发者角色的结构性转型

开发者的工作重点正从编写代码转向引导模型、设定任务范围及审查 AI 生成的代码。
在模型具备自主运作能力的背景下，保留人类的声音和控制权对维持软件的社会属性至关重要。

尽管 AI 已经能完成大部分编码工作并展现出超越普通开发者的漏洞分析能力，但在构建供人使用的产品时，人类的决策依然不可或缺。这种转型虽然改变了软件开发的初衷和乐趣，但开发者必须适应作为“模型控制者”的新角色，以应对网络安全攻防节奏彻底改变的新时代。

Community Posts

Write about this video