00:00:00今天早上我醒来时看到 X 上有篇帖子,提到 Anthropic 似乎把
00:00:09代码插件从 Pro 套餐中移除了,所以你需要更昂贵的订阅套餐
00:00:17才能使用代码功能,或者在代码功能中使用你的订阅权益。
00:00:22Anthropic 很快对此做出回应,称这只是一个小规模测试,
00:00:27他们仅针对 2% 的新专业用户进行了这项测试。
00:00:32我觉得进行这种测试有点奇怪,而且我认为 Anthropic 本应该
00:00:40预见到进行此类测试会带来的后果,以及这种测试对他们
00:00:47品牌形象的影响,以及人们会作何感想,因为这显然符合
00:00:53我们目前所看到的趋势,即订阅权益在缩水,我们看到
00:00:59更严格的限制,看到模型性能退化,似乎所有这些
00:01:08事情在过去几周里都在发生。我是说,Anthropic 大力打击了
00:01:14其订阅在代码功能之外的使用。例如,如果你想在 Open Cloud 中使用,
00:01:21他们对此进行了严厉限制,所以这一切描绘了一个清晰的更大格局。
00:01:28而与这个格局或论调相符的,是 GitHub 前几天发布的一篇新闻文章,
00:01:37他们明确表示将暂停 GitHub Copilot Pro、
00:01:43Pro Plus 和学生套餐的新用户注册,并且他们正在收紧个人套餐的使用限制,
00:01:49最重要的是,Opus 模型不再在 Pro 套餐中提供,当然这一切
00:01:56都有道理,但我们需要深入探讨其背后的经济逻辑,
00:02:02才能理解为什么会发生这种情况,最重要的是,这对我们未来的使用意味着什么。
00:02:07这显然意味着无限使用和重度补贴的时代已经结束了,要理解这一点,
00:02:17我们需要理解这些订阅的经济逻辑,或者说是 token 使用的经济学,
00:02:25或者说是 token 消耗,因为当然,Anthropic、
00:02:34OpenAI 和 GitHub 提供的这些订阅模式,只有在大多数用户没有真正用完
00:02:43他们所拥有的所有可用额度时才真正有效。这几乎适用于现有的任何订阅服务,
00:02:49不仅仅是这些 AI 订阅。如果你拥有 Netflix 订阅,却整天 24/7 不停地
00:02:56看 Netflix,那你很可能不会是他们非常有利可图的客户,但大多数人
00:03:02不会这样做,这就是这些公司能够获利的方式。这对所有订阅服务都显而易见。
00:03:10现在,如果我们查看这些公司的 API 定价页面,我们就能看到真正价格,
00:03:19或者说更接近我们 AI 请求真实成本的价格。例如,我们可以看到
00:03:26Anthropic 的最新模型 Claude Opus 4.7 的输入 token 价格为每百万 token 五美元,
00:03:35输出 token 价格为每百万 token 25 美元,我们可以将此
00:03:42与其他模型进行对比,当然也可以将其与 OpenAI 所提供的
00:03:47进行对比。例如,我们看到目前大多数代码用户可能正在使用的 GPT 5.4,
00:03:54输入价格为每百万 token 2.5 美元,仅为 Opus 4.7 的一半。
00:04:03而我们的输出价格为 22.50 美元,略低于我们看到的 Opus 的价格。现在,
00:04:11假设这些 API 价格能让这些公司
00:04:20处于盈亏平衡点或获得少量毛利,这可能是公平的,所以如果我们只看
00:04:29具体的推理成本,我们大概可以认为,如果你使用他们的
00:04:36API,他们就会盈利。当然,了解 AI 模型的运行成本
00:04:43最终取决于两个主要因素,这是至关重要的:AI 模型的训练成本
00:04:53和推理成本,所以这些 AI 公司涉及这两个因素。
00:04:59训练成本是一次性的,对吧?所以你训练一次模型
00:05:06非常昂贵,但显然这是一次性的。当然,这些公司随后
00:05:12训练越来越多的模型,每个模型都有新的初始成本,但一旦模型训练完成,
00:05:18它就不会再产生训练成本了,除了可能需要进一步微调运行或从
00:05:25该基础模型派生出的模型,但确实,大部分成本只发生一次。现在关于推理,
00:05:33情况则完全不同,这是一个持续的成本,最终是按请求计算的,因为
00:05:41推理是为你发送给模型提供商的提示或任务产生具体输出的过程,
00:05:48而推理正是当你使用代码功能、使用代码辅助工具时发生的事情,
00:05:53当然,当你发送提示词给 ChatGPT 或以任何其他方式使用时,也会发生。
00:05:58这当然是你至少想在 API 定价上实现盈亏平衡的地方,
00:06:07因为否则意味着你每收到一个请求都在亏钱,虽然你当然
00:06:13可以为了扩大市场份额而这样做,虽然我不排除有些公司
00:06:19偶尔会这样做,但从长远来看,这当然不可行,因为你会
00:06:25倒闭。当然,你也需要在某个时候赚回你的训练成本,所以理想情况下,
00:06:34用户发送给你的这些传入请求,在推理成本上为你提供了足够的毛利,
00:06:41以至于该利润也能覆盖你的训练成本、员工成本等等。所以当然,这就是
00:06:48运行和使用这些 AI 模型的经济学。正如提到的,
00:06:57API 定价大概是这些公司不会损失巨额
00:07:02金钱的部分,但作为消费者,作为客户,如果你用这些
00:07:10Opus 按需付费价格来运行代码功能,你支付的费用将远远高于你使用其订阅
00:07:18的费用,因为当然,以最高订阅为例,只需 200 美元,你就可以
00:07:26从中获得大量使用额度,你将获得数百万个 token,如果你
00:07:34看看通常情况下输出 token 每百万个的成本,你就会明白,
00:07:39通常情况下,如果你忽略输入 token(你不应该忽略),但如果你忽略这两百美元的输入,
00:07:44我们甚至不应该得到 1000 万个输出 token,对吧?因为每百万个
00:07:51成本为 25 美元,所以我们应该只能得到 800 万个输出 token,然后如果你考虑
00:07:56输入 token,那就会更少,显然如果你有任何长时间运行的会话,如果你已经
00:08:02使用代码功能一周左右,并且追踪了你的 token 使用量,你会发现你
00:08:08可以超过那个限制,而且你在过去绝对可以,这就解释了为什么
00:08:14这些公司正在试图限制你可以从订阅中获得的使用量,
00:08:19以及为什么我认为我们将来肯定会看到更高的订阅价格,也许已经在
00:08:25不久的将来就会出现。当然,这些公司想要提高价格并不容易,
00:08:30因为显然所有这些公司都希望激进地抢占市场份额,
00:08:37理由是如果你是主要建立作为编码代理提供商的公司,
00:08:45在许多企业、许多公司中,他们将来可能会支付更高的订阅
00:08:51价格,所以你不想过早提高价格,因为那可能会
00:08:57将你的一些客户推向你的竞争对手,这当然是你不想看到的。另一方面,
00:09:02你也不想倒闭。我是说,例如,OpenAI 最近筹集了 1220 亿美元
00:09:09来加速 AI 的下一阶段,你可以解读为这只会给他们
00:09:17大约 18 个月的运行资金,即在他们需要再次筹款前的 18 个月,所以显然你不能
00:09:26永远补贴所有这些使用量,因为如果你倒闭了,那么你所有的客户
00:09:32无论如何都会转向你的竞争对手,所以这里有一个权衡,这当然正是
00:09:39这些公司目前面临的困境,这就是这里的经济学。当然,正如你
00:09:44可能读到过,而且如果你是游戏玩家可能也感受到了,我们正处于一个时间点,因为
00:09:52所有正在发生的 AI 事情,我们正面临严重的计算短缺和危机,以及内存
00:10:01和所有与这些 AI 模型和 AI 数据中心所需的东西相关的高价,所以
00:10:08内存很贵,因为推理需要大量内存,如果你尝试本地运行模型,
00:10:13你知道你需要大量内存,所以内存价格上涨了,
00:10:19但不仅仅是内存,还有网络设备,因为你当然是在运行训练
00:10:25和推理,不是在单个芯片上,而是在巨大的机架和芯片集群上,所有这些
00:10:31集群在集群和芯片之间需要连接,这样你才能构建超级
00:10:36GPU,可以说,这种网络设备需求量很大,因此很昂贵。然后当然,
00:10:43我们还有能源和数据中心,我们需要两者,我们需要数据中心来放置那些芯片,这就是
00:10:52为什么那里正在进行大量建设,但这些数据中心需要能源,对吧?你
00:10:58也听说了,能源是另一个大问题,你无法从电网获得它,它根本不是
00:11:05为此而建的,那里没有足够的能源可用,这就是为什么所有这些新的数据中心都
00:11:12正在转向离网解决方案,即在数据中心旁边用燃气轮机
00:11:21或核能产生能源,但这当然都需要时间,它也需要组件,而且没有
00:11:28无尽的公司可以建造这些发电厂,没有无尽的
00:11:35建造这些发电厂所需的组件,所以这一切都限制了可以上线计算的量,
00:11:42这反过来对推理和当然训练来说是缺失的。
00:11:48现在,从历史上看,我的意思是只有一两年前,这些公司
00:11:54的动力是将大量的计算资源投入到训练中,因为这给了你
00:12:00更好的模型,让你保持领先或在 AI 竞赛中脱颖而出,这种动力仍然存在,但
00:12:07当然,如今推理部分也存在更大的动力和更高的重要性,
00:12:14因为推理部分为你带来了客户,为你带来了市场知名度,
00:12:19因为如果没人能使用你的模型,那么你拥有好模型是很棒,但你
00:12:25没有获得任何市场份额,所以你需要推理,这变得重要多了,所以公司不得不
00:12:30在这两个目标之间分配稀缺的计算资源和数据中心容量。而且
00:12:38尤其是从今年年初开始,我们也看到了客户使用行为的变化,
00:12:45GitHub 的那篇新闻文章其实对此非常坦诚,代理式工作流
00:12:51从根本上改变了 Copilot 的计算需求,长时间并行会话现在经常
00:12:57消耗远超原始套餐结构所能支持的资源,Anthropic 和 OpenAI 也是一样,
00:13:04在过去,再说一次,这只是指一年前左右,
00:13:10这些公司并不是主要地,但在很大程度上确实只关注偶尔的聊天会话,
00:13:20一个用户,一个客户会偶尔上来问 ChatGPT 或 Claude 一个问题,当然那
00:13:27可能是每天多次,但只是几个问题,几个回答,
00:13:33几个后续问题,当然比所有这些长时间运行的代理式
00:13:39工作流和编码会话使用的 token 要少得多,在那些编码会话中,或者你正在运行的任何代理式工作流中,
00:13:44你都在快速,非常快速地消耗数十万甚至数百万个 token,比你
00:13:51平时用偶尔的聊天会话消耗得快得多。现在考虑到我们正在处理的所有
00:13:58现代模型都是思维模型这一事实,token 总量也变
00:14:05得比一两年前高了,因为回答由于该思维过程 simply 需要更多 token,
00:14:12即使你在最终回答中没看到它们,也可能是这样,所以因此消耗的 token 总量
00:14:17现在比一两年前大得多,所以再次带我们回到这一点,即推理变得更重要,因为你需要远
00:14:24更多推理来处理正在进行的所有那些 token 生成,这就是为什么所有
00:14:29这些新模型在通过 API 使用时相当昂贵,但更重要的是为什么
00:14:37这些订阅对这些公司来说目前非常棘手,它们在过去
00:14:43引入了那些订阅,那时消耗的 token 少得多,现在它们处于
00:14:49一个点,即对于同样的订阅价格,人们现在正在使用多得多的 token,这就是困难所在。
00:14:56现在,尤其是对 Anthropic 来说,例如,我可以想象他们感受到的痛苦多一些
00:15:03不仅仅是因为如果我们只看看 API 定价,他们的模型运行起来似乎更昂贵,
00:15:09而且当然也是因为从历史上看,即使是一年前,Anthropic
00:15:16已经拥有更多企业和商业客户,这对他们来说在某种程度上是好事,这是一个稳定的
00:15:22收入基础,而 ChatGPT 或 OpenAI 一直更偏向消费者,他们拥有更多普通人
00:15:29作为客户,而现在他们也正在更多地转向商业,但从历史上看,因为他们
00:15:38经历了 ChatGPT 时刻,他们有更多普通人作为客户,Anthropic 的缺点现在
00:15:43当然是,这些商业客户正是正在运行这些代理式
00:15:50工作流或者倾向于运行这些代理式工作流的客户,我是说,你的父母,如果他们
00:15:55真的在为 ChatGPT 付费,尽管他们很可能没在付,他们也没有在运行代理式工作流,
00:16:00但你在运行,你的公司在运行,这当然使订阅对
00:16:06Anthropic 来说,我想象比对 OpenAI 来说更困难,因为那里仍然有大量普通人在订阅中,
00:16:11我猜他们肯定也感受到了痛苦,这一切意味着什么?现在,这些变化意味着什么,
00:16:18或者像这个 X 帖子中的变化,Anthropic 正在进行测试以将 Claude
00:16:24代码功能从更便宜的套餐中移除,这一切对我们意味着什么?我想很明显,我们会在未来看到更
00:16:32严格的限制,因此我们当然可能会到达一个点,即订阅
00:16:38感觉不再那么值得了,我认为那将是我们看到
00:16:42价格上涨的时候,相信这些编码订阅或一般情况下,认为是不合理的
00:16:48这些代理式使用订阅在某个时候每月花费数千美元是不合理的,这不太可能
00:16:55今年,但会在某个时候,因为当然,公司可能会开始将
00:17:03这些订阅的成本与员工成本进行比较,是的,这当然不是什么好消息,而且
00:17:10这可能是完全错误的,但绝对是我认为会发生的事情,当然当你做出
00:17:17那种比较时,这些订阅有很大的空间变得昂贵得多,
00:17:23显然,届时这些订阅将不再适合普通人,所以我想我们也会看到
00:17:30针对他们的新的订阅产品,这些产品只是有更严格的使用限制,足以
00:17:35满足 ChatGPT,但不足以满足代理式工作流,但对于专业用途,对于代理式
00:17:41工作流,我们会看到更严格的限制和更高的价格,我不确定是什么时候,因为你知道,市场
00:17:47份额嘛,所以这就是我之前提到的,但最终我们会看到,因为最终
00:17:52正如提到的,OpenAI 有大约 18 个月的运行资金,他们可能想留在该业务中,
00:17:58Anthropic 也是一样,因此这就是我认为我们在一年左右的时间里会在这里看到的,我不知道。
00:18:03最终会发生什么。