我在代码库里放了 30 个 AI 智能体 (Gas Town)

BBetter Stack
Computing/SoftwareSmall Business/StartupsManagementInternet Technology

Transcript

00:00:00想象一下,如果 Claude Code 不仅仅是一个助手,而是一整个团队,20、30 甚至 50 个智能体
00:00:06并行工作,在你关注的同时交付功能。
00:00:09这就是 Gastown。
00:00:11它不是在和 AI 聊天,它是一座工厂。
00:00:14它能分解功能,分配并行任务,自动合并代码,
00:00:20并在 Git 中持久化所有内容,即使崩溃也能持续运行。
00:00:23这可能会让你的产出翻 10 倍,也可能让事情变糟。
00:00:27让我们深入了解一下配置以及它究竟是如何运作的。
00:00:35Gastown 是一个开源编排器,它能将 AI 编程智能体
00:00:39变成类似于开发工作流中的 Kubernetes。
00:00:43首先,Gastown 本身不是 AI 模型,它只是一个编排器。
00:00:48它运行在 Claude Code 等工具之上,将它们转化为协调的多智能体系统。
00:00:53你给它所谓的“市长”(Mayor)设定一个高阶目标,“市长”会将目标
00:00:58拆解为名为“珠子”(Beads)的结构化任务单元。
00:01:02随后,“珠子”会被分组为“车队”(Convoys),接着由名为“艾鼬”(Polecats)的
00:01:07工作智能体并行执行。
00:01:09这非常重要,原因有几点。
00:01:11所有操作都通过 Git 运行。
00:01:13每个智能体都在分支上工作,合并队列,状态被持久化,所以如果程序崩溃,
00:01:20你不需要从头再来。
00:01:21现在对比一下常规的“感性编程”(vibe coding),或者说普通的 AI 编程。
00:01:26那是单次会话、线性执行、上下文偏移、手动编排,简直是一团糟。
00:01:32Gastown 基本上是认知的水平扩展,这意义重大。
00:01:37但真正的问题是,它真的有效吗?
00:01:40如果你喜欢这类内容,请务必订阅。
00:01:42我们经常会发布新视频。
00:01:44现在让我们开始,启动它并做一些测试。
00:01:47好了,我这里运行着一个简单的待办事项应用。
00:01:49我在 GitHub 上找了一个非常简单的 Go 语言版本。
00:01:53我选择 Go 是因为 Gastown 主要也是用 Go 编写的,但实际上
00:01:58你选择什么项目都没区别,它都会照常执行。
00:02:02这个待办事项应用目前没有身份验证功能,只是一个基础的增删改查(CRUD)应用。
00:02:06如果你曾经给现有应用添加过身份验证,你就知道那种
00:02:11担心搞坏代码的痛苦。
00:02:12这从来不是“添加登录”那么简单,它涉及数据库更改、路由、中间件、表单、测试、Docker 等一切。
00:02:18当你构建这些应用时,各个部分都是环环相扣的。
00:02:22我们要测试的挑战是:Gastown 能否在不需要我微观管理的情况下完成这些?
00:02:26老实说,这里的环境配置挺麻烦的。
00:02:30我需要通过 brew 安装很多大型软件包,整理各种依赖,
00:02:35甚至安装好后,为了让它跑起来也花了不少时间进行故障排查。
00:02:39但一旦同步好所有内容,它的运行效果确实非常出色。
00:02:43现在它运行起来了,我接入“市长”并给它一个提示词。
00:02:46我会说:添加 JWT 验证,使用基础的 SQLite,创建登录和注册
00:02:52接口,保护路由,添加 HTML 表单,编写测试,并添加 Dockerfile。
00:02:58就这样。
00:02:59但这可是很多工作,对吧?
00:03:00这么多事情同时进行。
00:03:01不需要分步骤引导,让我们看看实际会发生什么。
00:03:05“市长”现在开始自动分解这些功能。
00:03:10数据库结构、中间件、验证接口、前端表单、测试,这些都变成了独立的“珠子”,
00:03:18记住,一个“珠子”就像是一个工人。
00:03:21看,现在所有的“艾鼬”都开始集体出动了。
00:03:25一个智能体创建 SQLite 结构,一个编写 JWT 中间件,一个构建
00:03:31登录和注册路由,另一个更新 UI 表单,还有一个编写集成
00:03:37测试和 Docker 配置文件,所有这一切都在同步进行。
00:03:40这就是巨大的反差。
00:03:42如果你单独使用 Claude Code,你需要按顺序来。
00:03:47你要提示、等待、修复、再提示、不断解释上下文,对吧?
00:03:52这通常就是编程智能体的工作方式。
00:03:55但在这里,Git 分支隔离了工作,合并被排队处理,状态被实时追踪。
00:04:00所以不再是由你大脑记住整个计划,而是由系统代劳。
00:04:05哪怕中途崩溃了也没关系。
00:04:09你可以稍后自动从持久化的状态中恢复。
00:04:13现在是见证奇迹的时刻。
00:04:14我把它 fork 到了一个仓库里,现在我想在我的 GitHub 上
00:04:19查看它所做的所有更改和添加的内容。
00:04:22我们可以看到旧代码,而除此之外的其他部分都被编辑过。
00:04:25注册、登录、令牌发放、受保护路由正常工作、测试通过,所有这些内容。
00:04:32这些都是通过 Gastown 添加进来的。
00:04:35整个功能在短短几分钟内就被分解并实现了。
00:04:39这就是重点。
00:04:40区别不仅在于速度,更在于“认知卸载”。
00:04:44我们不再需要管理 AI 的每一个微小步骤,但这并不意味着它
00:04:49百分之百会成功。
00:04:50因为运行它可能又是另一回事。
00:04:52现在让我快速运行一下。
00:04:53让我们看看结果如何,以及我们现在面对的是什么。
00:04:56总的来说,这就是它的样子。
00:04:58还不错,一个非常基础的应用。
00:05:00你可以看到我可以在这里登录,创建一个账号。
00:05:03待办事项列表功能依然正常,它没有改动这部分。
00:05:06它添加了路由、Docker 文件,以及所有关于 JWT 验证的额外内容。
00:05:11所以这次表现真的很棒。
00:05:12我很想看看它在更大规模应用上的表现,但这次尝试确实
00:05:16消耗了我大量的 token。
00:05:18说到这里,我们来聊聊权衡利弊。
00:05:21也就是优缺点,对吧?
00:05:23首先是优点:可扩展性。
00:05:25这真的很酷。
00:05:27你可以同时拥有 20 到 30 个智能体在工作。
00:05:30这意味着在开发大型功能时会有海量的产出,而以前这类工作
00:05:35常会让一个人陷入任务堆和复杂的依赖关系中。
00:05:37第二点,另一个很酷的功能是 Git 持久化。
00:05:40不再有那种脆弱的 AI 会话,一旦崩溃所有内容都会消失,
00:05:45然后我们不得不重新开始。
00:05:47这些都是非常、非常棒的功能。
00:05:48但现在来说说缺点,因为这才是让大家感到意外的地方。
00:05:50我也对其中一些点感到惊讶,但它们确实合乎逻辑。
00:05:54“审查疲劳”:是的,系统产出了海量内容,但你也得
00:06:00审查海量内容。
00:06:01它的生产力可能极高,但也可能让你心力交瘁。
00:06:04然后是成本问题。
00:06:06高频使用会导致费用飞涨。
00:06:07我们不只是运行一个智能体。
00:06:09我们是在并行运行所有这些智能体。
00:06:11这笔账你可以自己算一下。
00:06:13智能体之间仍可能产生冲突。
00:06:14它们可能会过度设计。
00:06:15由于你给了它们完全的控制权,它们完全有可能搞砸你的仓库。
00:06:19这并不是即插即用的,由此引出了一个真实的问题。
00:06:23你真的想在工作流中使用这种工具吗?
00:06:27还是说它有点过头了?
00:06:29当然,你也可以选择其他供应商,比如 Claude 或 OpenAI,选择权在你。
00:06:34虽然这还是个早期工具,但它指向了一个更宏大的愿景,
00:06:38因为趋势很明显:这不再仅仅是“AI 辅助你编程”。
00:06:43这是“AI 通过多智能体并行运行来改变工作流”。
00:06:47所以 Gastown 代表了从 AI 助手到多个智能体协同工作的转变。
00:06:54这改变了我们的杠杆效率,因为现在你可以同时
00:07:00编排后端、前端、测试、文档和基础设施。
00:07:03这可能会让你效率倍增,或者重新定义开发的含义。
00:07:09问题不在于多智能体系统是否会到来。
00:07:12它们已经来了,对吧?
00:07:13这就是一个例子。
00:07:14现在的问题变成了:你是现在就开始尝试,还是以后再说?
00:07:19因为谁知道呢?
00:07:20它们正在普及。
00:07:21订阅以获取更多正在重塑开发工作流的工具和技巧。
00:07:25我们下期视频再见。

Key Takeaway

Gastown 通过将高阶目标拆解为并行任务并利用 Git 进行持久化管理,实现了从 AI 辅助编程到大规模多智能体协同开发的效率飞跃。

Highlights

Gastown 是一个开源的 AI 编排器,能将 Claude Code 等工具转化为高效的并行多智能体系统。

该系统采用层级化架构,通过“市长”(Mayor)拆解任务,并由多个“艾鼬”(Polecats)并行执行。

所有操作基于 Git 运行,具备状态持久化功能,即使程序崩溃也能从断点恢复而无需重头开始。

在实际测试中,Gastown 仅凭单一指令就完成了从数据库更改、JWT 验证到 Docker 配置的全栈功能开发。

虽然极大地实现了“认知卸载”,但用户仍需面对“审查疲劳”以及多智能体并行带来的高昂 Token 成本。

多智能体协作代表了 AI 编程从“对话助手”向“自动化工厂”工作流的重大范式转变。

Timeline

Gastown 概念引入与核心价值

视频开篇提出了一个大胆的设想,即不再将 AI 视为单一助手,而是将其作为拥有数十个智能体的完整团队来协同工作。主讲人介绍了 Gastown 这款工具,将其定义为一种像工厂一样运作的代码生成系统,能够实现功能的自动拆解与并行交付。Gastown 的核心优势在于它不仅能通过 Git 持久化所有操作,还能在系统崩溃时保证进度不丢失。这种模式旨在将开发者的产出提升至原来的 10 倍,但也伴随着复杂性增加的风险。这一节强调了从简单的“AI 聊天”向“AI 自动化工厂”转变的必要性。

系统架构与工作原理深度解析

主讲人详细解析了 Gastown 作为开源编排器的内部逻辑,将其比作开发工作流中的 Kubernetes。系统中设有“市长”(Mayor)角色负责设定高阶目标,并将其拆解为名为“珠子”(Beads)的结构化任务单元。这些任务随后会被分组为“车队”(Convoys),并由被称为“艾鼬”(Polecats)的工作智能体在独立分支上并行执行。与传统的线性“感性编程”(vibe coding)相比,Gastown 通过 Git 队列和状态追踪实现了认知的水平扩展。这种架构确保了即使在网络或程序中断的情况下,整个开发过程依然具备极高的鲁棒性。

实战演示:为 Go 应用添加身份验证

为了验证 Gastown 的实际效能,主讲人使用一个简单的 Go 语言待办事项应用进行了压力测试。测试挑战要求智能体在不进行微观管理的情况下,同时完成 JWT 验证、SQLite 存储、路由保护、前端表单编写及 Docker 化。在输入模糊的高阶指令后,“市长”迅速将任务拆解,多个智能体开始同步编写中间件、数据库结构和集成测试。这种并行工作的模式与传统的单次会话式 AI 形成了鲜明对比,省去了开发者反复解释上下文的麻烦。尽管环境配置过程较为繁琐,但一旦运行,系统展现出了极强的自动化编排能力。

成果展示与运行效果评估

任务完成后,主讲人展示了 GitHub 仓库中生成的代码,确认所有预设功能如注册、登录和令牌发放均已正常实现。在实际运行中,应用不仅保持了原有的待办事项功能,还完美集成了新添加的受保护路由和 Docker 配置文件。这证明了 Gastown 在短时间内处理多维度任务的卓越能力,真正实现了“认知卸载”。虽然整个过程消耗了大量的 API Token,但其交付的速度和完整性令人印象深刻。这一节通过实际的运行结果,验证了多智能体并行开发在处理复杂工程时的可行性。

优缺点权衡与行业未来展望

在总结部分,主讲人客观地分析了 Gastown 的优缺点,指出其最大优点在于极高的可扩展性和 Git 持久化带来的稳定性。然而,用户必须警惕“审查疲劳”,因为并行产出的海量代码需要大量的人工审核精力。此外,高昂的 Token 成本和潜在的智能体逻辑冲突也是目前不可忽视的技术挑战。Gastown 的出现标志着 AI 编程已从单纯的“辅助”转向“工作流重塑”,多智能体系统正在成为行业主流。主讲人最后呼吁开发者积极尝试这类工具,以应对即将到来的开发范式大变革。

Community Posts

View all posts