深度解析 Anthropic 与 xAI 的合作协议

MMaximilian Schwarzmüller
Computing/SoftwareSmall Business/StartupsBusiness NewsSpace/AstronomyInternet Technology

Transcript

00:00:00昨天,Anthropic 宣布了两则非常有趣的消息,这对开发者有着深远影响,
00:00:07而且这些新闻背后的内幕,可能比你乍看之下要多得多。
00:00:14因为他们宣布将大幅上调使用 Claude 的额度限制,
00:00:19这对于使用 Claude Code 的用户尤为重要,因为很有可能像
00:00:24许多人一样,你经常会触碰到那些使用限制,并觉得它们有点过于严苛,
00:00:31尤其是当你将其与 Codex 的使用限制进行对比时。
00:00:35而他们昨天宣布的另一件大事,实际上与第一项公告息息相关,
00:00:40那就是他们与 SpaceX 达成了一项算力协议,他们将租用
00:00:48整个 Colossus 1 数据中心,也就是埃隆·马斯克在 2024 年
00:00:55创纪录时间内建成的那个数据中心;他们将租用全部算力,大约为 300 兆瓦,
00:01:03他们将把这些算力用于训练或推理,从而拥有更多的处理能力。
00:01:11这自然会影响到他们能提供的额度限制,虽然事情不止于此,但这很重要,
00:01:15因为 Anthropic 曾深受算力瓶颈的困扰,而且公平地说,他们现在依然如此,
00:01:22所有大型 AI 公司都面临这种困境,因为我们都处于这种
00:01:29情况中,或者说他们都面临着:对 Token 的需求并非呈
00:01:36线性增长,而是由于各种原因呈现出指数级增长,因为我们现在
00:01:45拥有了支持更长时间运行的智能体任务、智能体编程任务的模型,
00:01:53无论你用它们做什么。这些现代模型及其智能体框架不仅仅擅长编程,
00:01:59在数据科学等其他任务上也表现出色,因为
00:02:04它们在这些领域也会生成代码,但那是另一个话题了。因为这些模型及其
00:02:10运行工具变得如此强大,且现在可以运行更长时间,
00:02:16你我以及所有用户都在消耗多得多的 Token,这完全不在
00:02:23这些公司的预料之中,Anthropic 显然没有为此准备足够的容量,
00:02:29因此才有了他们与 SpaceX 达成的这项算力合作伙伴协议。
00:02:38现在有趣的是,他们在博文中提到,正如我所说的,
00:02:43会立即增加这 300 兆瓦的新容量,这相当于超过 20 万张 NVIDIA GPU,
00:02:51再次重申,这是 2024 年的数据,但这仍然是他们目前可以增加的海量算力,
00:02:57这加入了他们其他重大的算力公告中,那些数字甚至更令人咋舌,
00:03:02他们分别与亚马逊和谷歌达成了高达 5 吉瓦(GW)的协议,
00:03:10但值得注意的是,那些容量大多处于规划阶段,还没有
00:03:16真正上线。
00:03:17他们与亚马逊达成的 5 吉瓦协议中,包含到 2026 年底
00:03:25交付的近 1 吉瓦新容量。所以,我们离那 5 吉瓦还远着呢,
00:03:33而与谷歌的协议同样是 5 吉瓦,将于 2027 年开始上线,
00:03:39所以那也还没到位。我们谈论的是这 10 吉瓦,在目前
00:03:44几乎是完全不可用的。
00:03:47但是来自 xAI 数据中心的这 300 兆瓦却是现成的。
00:03:52随之而来的一个问题当然是,这对 xAI 意味着什么?
00:03:57他们自己不需要这些算力吗?
00:03:58这是 Grok 的终结吗?
00:04:00答案是否定的,嗯,显然不是 Grok 的终结,但我认为可以公平地说,
00:04:03如果 Grok 的需求哪怕有一点点
00:04:11接近 Anthropic 所看到的水平,
00:04:21他们就不会把多余的算力租出去,相反,很显然,
00:04:27他们不需要这些算力给 Grok 使用。你可能会好奇为什么?
00:04:31答案是,这个 Colossus 数据中心,正如我提到的,
00:04:37在 2024 年用 122 天的创纪录时间建成,这本质上只是他们建造的第一座数据中心,
00:04:46但 xAI 现在有了更强大的 Colossus 2 集群可供自己使用,所以他们
00:04:54可以将其用于训练和推理。这还不是唯一的数据中心,他们还收购了
00:04:59另一个数据中心,即 Macro Hardware 数据中心,xAI 正在朝着近
00:05:062 吉瓦算力总量的路线图前进,运营将于 2026 年全面展开。所以并不是 xAI 放弃了
00:05:14他们所有的算力,当然只是其中一部分。显然,如果
00:05:18Grok 有更多需求,他们是不会这么做的。但现状是,这为他们提供了一个
00:05:24利用闲置算力并赚取额外收入的好方法,而对于 Anthropic 来说,
00:05:29这当然意味着他们现在有了更多的可用容量,从而带来了更高的使用
00:05:35额度限制。我认为这一切比你想象的要更微妙一些:显然 Anthropic 曾
00:05:43深受算力限制,我是说所有 AI 公司都在为了获取足够的
00:05:50算力而挣扎,我已经在另一期视频中谈过这个话题了,这里就不再赘述,
00:05:56但算力的确是个大问题,因为需求在指数级增长,因为
00:06:02那些长时间运行的智能体任务,以及在这些需要推理的任务中
00:06:08消耗掉的所有 Token。没错,这就是核心点,
00:06:14但现在 Anthropic 终于可以提高那些使用限制了,因为他们现在
00:06:21有了更多的可用容量。这很棒,但此外,我认为
00:06:27他们也面临着保持竞争力的压力,这也是我
00:06:32在另一期视频中讨论过的。因为正如我提到的,过去我们看到 GitHub Copilot
00:06:39转向了基于使用量的计费模式。现在他们有自己的理由,他们也曾有过定价模型,
00:06:47或者基本上是根据你的支付额、订阅费
00:06:54给你一定数量的请求。当然,按照请求数收费
00:07:01而不是按 Token 收费并不理想,因为既然我们有了长时间运行的任务,
00:07:06可能一次请求包含的 Token 比过去要多得多。但当然,他们也可以
00:07:10使用 Token 计量系统,结果他们直接从订阅制
00:07:16转向了按量计费。所以他们这么做了,而 Anthropic 当时有着非常
00:07:24严格的使用限制,虽然仍是订阅制且基于 Token,但与 Codex 相比还是太严了。
00:07:31Codex 显然是他们最大的竞争对手,即 OpenAI 的 Codex 模型,
00:07:37或者现在的 GPT 5.5 模型,以及 Codex 工具及其订阅方案,你可以
00:07:43在 Codex 中获得更慷慨的使用量,直到现在你在 Codex
00:07:50和 GPT 5.5 中依然能获得大量额度,而且 GPT 5.5 确实是一个非常出色的模型。所以自然而然,我认为 Anthropic
00:07:58有巨大的动力保持竞争力,扩大其市场份额。顺便说一下,他们正经历惊人的
00:08:03收入增长。如果你想学习如何充分利用 Codex 和 Claude
00:08:09Code,如何使用高级功能,而不仅仅是你已经知道的基础知识,
00:08:15那么你可能想看看我的课程,甚至加入会员,这样你就可以
00:08:20通过固定的月费或年费访问我所有的课程。链接就在下方。但如前所述,
00:08:26Anthropic 正在强劲增长,他们可能希望继续保持这种增长
00:08:32势头。而且由于他们拥有所有这些算力,或者说由于他们拥有所有这些
00:08:39即将在未来一年左右上线的容量,所以他们想要利用它,他们想要
00:08:43在此基础上进一步增长。他们最终需要收入和资金来支付
00:08:50这些容量。所以显然他们想继续激进扩张,当然是在不疯狂烧钱的前提下。
00:08:56但他们想继续增长,想要扩大市场份额,以便
00:09:00最终在某个时间点提高价格,这肯定会发生的。
00:09:05这就是为什么我们能获得更高额度限制的原因。显然,正如我提到的,这还结合了
00:09:11他们现在不再像以前那样受算力瓶颈困扰的事实,尤其是在
00:09:16达成 SpaceX 的协议后。但这项交易还有更多内幕,因为我已经提到过,
00:09:23xAI(如果你不知道的话,它是 SpaceX 的一部分),如果他们自己
00:09:31需要的话,是不会把 Colossus 1 数据中心租给 Anthropic 的。显然他们不需要,
00:09:38但他们可以从中获得另一个优势。因为在 Anthropic 的公告中,
00:09:43有这样一句有趣的话:“作为协议的一部分,我们还表达了
00:09:49与 SpaceX 合作开发数吉瓦级别轨道 AI 算力的兴趣。” 呵,
00:09:56这很有趣,因为 SpaceX(万一你没注意到)正计划发射轨道数据
00:10:02中心,这在某种程度上是合理的。我是说,把东西送入太空是他们的强项。
00:10:09这就是最终为收购 xAI 所做的辩护,这本身就是一个非常有意思的交易。
00:10:15顺便说一下,埃隆·马斯克意外买下 Twitter,然后创立
00:10:22xAI,接着让 xAI 买下 X (Twitter),再让 SpaceX 买下 xAI,所有这些
00:10:29都是在投资者的帮助下完成的,这真是个变富的聪明办法。但论据之一
00:10:34当然是他们想要发射轨道数据中心,这就是
00:10:40收购 xAI 交易背后的原因。现在,他们显然把 Anthropic 也拉入伙了,或者是吗?
00:10:46嗯,也许不一定。他们只是“表达了兴趣”,所以这很可能只是
00:10:52双方商定写进去的一句话,好让 SpaceX 在今年晚些时候尝试
00:10:58公开上市 (IPO) 时有个好故事。这样他们就可以说,
00:11:04这不只是为了他们自己的数据中心,他们还拉拢了 Anthropic 等客户。
00:11:09所以这是一个不错的交易。Anthropic 得到了 Colossus 1 数据中心,未来也可能
00:11:14使用轨道数据中心,但目前并没有做出承诺。因为轨道
00:11:19数据中心还存在一些问题。目前尚未证明这是否真的是一项好的投资,
00:11:26以及它们是否真的能击败地球上的数据中心并提供显著的优势,
00:11:32但他们可能会加入。再次强调,对于 SpaceX 来说,能在 IPO 时把 Anthropic
00:11:37标榜为潜在的未来客户是非常有利的。我认为这就是关于
00:11:46这项交易值得了解的内容。好消息是额度限制提高了,而且未来
00:11:53Anthropic 会有大量容量上线。但正如我向你展示的,这背后还有更多内幕。
00:11:59这对我们开发者或者全人类来说是好事还是坏事,又是另一个故事了。
00:12:05你对 AI 可以有不同的看法,正如你所知,如果你听过我其他的节目
00:12:11或看过我其他的视频,我确实也有自己的看法。但这就是 Anthropic 正在发生的事,
00:12:16以及它在短期内对我们开发者的意义。

Key Takeaway

Anthropic 通过租用 xAI 现成的 300 兆瓦算力容量即时提升了 Claude 的使用额度限制,并计划在 2027 年前通过亚马逊和谷歌协议将总容量扩展至 10 吉瓦以上。

Highlights

  • Anthropic 通过租用 SpaceX 下属 xAI 的 Colossus 1 数据中心,新增了 300 兆瓦的算力容量。

  • 此次算力扩张相当于增加了超过 20 万张 NVIDIA GPU,旨在解决 Claude 用户长期面临的额度限制瓶颈。

  • Anthropic 与亚马逊和谷歌分别签署了 5 吉瓦(GW)的长期协议,但大部分容量要到 2026 年底或 2027 年才会上线。

  • xAI 的 Colossus 1 数据中心仅用 122 天建成,目前因 xAI 转向更强大的 Colossus 2 集群而产生闲置算力。

  • Anthropic 在合作协议中表达了对 SpaceX 轨道 AI 数据中心合作的兴趣,这可能助力 SpaceX 计划中的 IPO 叙事。

  • 智能体编程任务的需求呈指数级增长,导致 Token 消耗量远超 AI 公司的预期。

Timeline

Claude 额度大幅上调与算力缺口

  • Claude 的使用额度限制迎来了显著上调。
  • 智能体框架执行长时间编程任务导致 Token 需求呈现指数级增长。
  • Anthropic 之前的算力储备未能预料到智能体任务带来的海量消耗。

开发者在使用 Claude Code 时经常触碰严苛的限制,这限制了模型在复杂编程任务中的表现。由于现代模型在数据科学和智能体编程中的运行时间变长,算力瓶颈成为了 Anthropic 必须解决的生存问题。这种需求增长是非线性的,迫使公司寻找立竿见影的容量补充方案。

三大云服务商的算力版图对比

  • xAI 提供的 300 兆瓦容量由超过 20 万张 GPU 组成且现成可用。
  • 与亚马逊达成的 5 吉瓦协议中,仅有 1 吉瓦计划在 2026 年底前交付。
  • 与谷歌达成的 5 吉瓦算力协议需等到 2027 年才会开始上线。

虽然 Anthropic 纸面上拥有来自亚马逊和谷歌总计 10 吉瓦的算力承诺,但这些基础设施目前几乎完全不可用。绝大部分规划容量处于建设或规划阶段。相比之下,来自 SpaceX 数据中心的 300 兆瓦虽然规模较小,却是目前唯一能填补空缺的实时资源。

xAI 租出算力的动机与内部路线图

  • xAI 租出 Colossus 1 是因为其推理需求未达预期且已拥有更先进的集群。
  • xAI 正在建设近 2 吉瓦总量的算力路线图,预计 2026 年全面运营。
  • 出租闲置算力为 xAI 提供了在研发 Grok 之外的额外现金流。

Colossus 1 曾创造了 122 天的超快建造纪录,但随着 xAI 转向 Colossus 2 以及收购 Macro Hardware 数据中心,第一代中心的算力出现了冗余。将这部分算力租给竞争对手 Anthropic,反映出目前 Grok 的实际使用需求尚不足以消耗掉其自建的所有算力资源。

市场竞争压力与订阅模式转型

  • Anthropic 面临来自 OpenAI GPT 5.5 和 Codex 慷慨配额的直接竞争。
  • GitHub Copilot 已从固定订阅制转向按量计费模式以应对高 Token 消耗。
  • 提高额度限制是 Anthropic 扩大市场份额并为未来潜在涨价铺路的核心策略。

为了在 AI 工具市场保持竞争力,Anthropic 必须匹配对手的可用性。虽然收入正在强劲增长,但公司需要更多的资金来支付未来几年即将上线的庞大算力成本。通过现在激进扩张市场份额,公司可以在建立用户粘性后,在未来某个时间点调整定价结构。

SpaceX 的轨道数据中心与 IPO 战略

  • Anthropic 表达了与 SpaceX 合作开发数吉瓦级别轨道 AI 算力的兴趣。
  • 轨道数据中心是 SpaceX 整合 xAI 资源并推向资本市场的关键叙事。
  • 目前轨道 AI 算力的投资回报比和技术优势尚未在地球环境外得到证实。

SpaceX 计划通过发射轨道数据中心来发挥其航天成本优势。在协议中加入关于轨道算力的“意向”声明,更像是一种公关手段,旨在为 SpaceX 即将到来的 IPO 提供更有吸引力的商业故事。对于 Anthropic 而言,这不仅解决了眼下的算力危机,也为其未来的技术演进留出了想象空间。

Community Posts

View all posts