我试用了这款模仿外卖团队运作模式的 AI 编程工具 (Routa)

BBetter Stack
Computing/SoftwareManagementInternet Technology

Transcript

00:00:00这是 Ruda,一款开源的 AI 编码工具
00:00:03它能让你的智能体更接近于
00:00:05一个交付系统。
00:00:07而不是那种复制仓库上下文然后祈祷它能跑通的工具,
00:00:11这是一个带有待办事项、开发、审查、
00:00:14证据和关卡的交付系统。
00:00:16因为 AI 编码工具确实让我们变快了,
00:00:19但也给了我们一项新工作:管理 AI。
00:00:22Ruda 是免费、本地优先的,并且
00:00:25围绕 AI 智能体的看板构建。
00:00:27让我们看看它是否真的名副其实。
00:00:30(标志提示音)
00:00:34大多数 AI 开发工具都会撞上同样的墙。
00:00:36首先是聊天地狱。
00:00:38所有重要信息都困在对话里。
00:00:42计划、失败的尝试、修复方案、
00:00:44那些奇怪的权宜之计,全都锁在
00:00:46不断向上的滚动条里。
00:00:47我们经常这么做。
00:00:48其次是缺乏可追溯性。
00:00:50AI 修改了代码,但你往往不知道
00:00:53它尝试了什么、为什么要选那个方案、
00:00:56或者它到底用了什么证据来支撑它。
00:00:58最后,根本没有真正的质量关卡。
00:01:01我们还得不停地问:它跑测试了吗?
00:01:04它检查过 diff 了吗?
00:01:06它真的遵守验收标准了吗?
00:01:08这就是症结所在,因为写代码
00:01:10不等于交付软件。
00:01:13Ruda 的理念其实挺简单的。
00:01:16别再把 AI 编码当成聊天会话了。
00:01:19把它当作一个带有任务、
00:01:22智能体、审查阶段、证据和关卡的交付流水线。
00:01:25简而言之,就是将 CI/CD 思维引入 AI 辅助软件开发。
00:01:30现在,看看这如何改变工作流。
00:01:32如果你喜欢用编码工具来提升工作效率,
00:01:34请一定要订阅。
00:01:35我们会持续发布相关视频。
00:01:37这是 Ruda 桌面端应用。
00:01:39只需拉取仓库并运行 Docker Compose up,
00:01:42即可通过 Docker 自托管,非常适合喜欢自托管的朋友。
00:01:45虽然我在尝试同步 Git 仓库时遇到了一些问题,
00:01:48所以最后选择了桌面端,开箱即用。
00:01:52我来创建一个工作区,连接我现有的一个真实仓库,
00:01:56然后选择看板模式。
00:01:58它启动后,我要给它
00:02:00一两个小任务。
00:02:02伙计们,别担心,我不是要从头构建
00:02:05整个应用,只是那种你在正常开发过程中
00:02:07实际上会交给 AI 工具处理的任务。
00:02:11通常情况下,我得打开一个空白聊天框
00:02:14尝试写一个非常好的提示词。
00:02:16但在这里,我添加任务后,它会自动
00:02:19添加到看板上。
00:02:22任务不再漂浮在聊天记录里。
00:02:25它现在有了归属地。
00:02:27任务从待办事项(Backlog)开始。
00:02:30随着 AI 处理进度,它会移动到开发中(In Development),
00:02:34对应的智能体会接手处理。
00:02:36现在你能看到移交过程,这一切
00:02:38都是自动完成的。
00:02:39所以它正在经过不同的阶段。
00:02:41这听起来虽小,但意义重大。
00:02:44我依然可以检查流程、输出结果
00:02:46以及 AI 在做什么。
00:02:48在一个任务内部,你甚至可以在它
00:02:51运行流程时与它聊天。
00:02:54所以比起伪装成工作流的一个巨大聊天框,
00:02:56这个工作流现在是可视化的。
00:02:59我有证据,有追踪记录。
00:03:01我能看到到底改了什么,检查了什么,
00:03:03以及任务处于开发的哪个阶段。
00:03:07它可以使用 OpenCode 或任何你想要的 AI 智能体。
00:03:11你可以连接你的 AI API,选择你喜欢的模型。
00:03:14为了演示,我同步了 Anthropic 的密钥来使用 Claude。
00:03:18现在让我们剖析一下 Ruda 到底是什么。
00:03:21它并不是想成为另一个 AI 聊天框。
00:03:23这一点至关重要。
00:03:25核心理念其实就是看板。
00:03:28把它想成是你的 AI 智能体
00:03:30必须完成的项目板。
00:03:32一个任务在一条泳道开始,移动到下一条,
00:03:35然后通过各个阶段。
00:03:37不同的智能体可以处理不同的阶段,
00:03:39只要你连接了相应的 API 密钥。
00:03:42所以不是让一个智能体包办一切,
00:03:44从规划、编码、审查、测试到解释,
00:03:47Ruda 为工作提供了结构。
00:03:50你创建一个工作区,连接一个仓库,
00:03:52定义一个任务。
00:03:55智能体在这个结构内工作。
00:03:56它还使用 MCP 和 ACP 等智能体协议。
00:03:59你可以随时加入这些协议。
00:04:03它更像是协调软件智能体的基础设施。
00:04:06Ruda 不仅仅是问 LLM,
00:04:08“嘿,Claude,这样看起来好吗?”
00:04:10它试图增加检查、适应度函数、
00:04:12“嘿,Claude,你看这样行吗?”
00:04:14它试图加入检查机制、适应性函数、
00:04:17我们该如何使用它?
00:04:19它如何加速我们的工作流?
00:04:22很多开发者都会经历同样的 AI 编码曲线。
00:04:23你请求一个函数,它就给你吐出来。
00:04:25你请求测试,它也给你吐出来。
00:04:29你粘贴一个错误,它会怎么做?
00:04:32它给你一个修复方案。
00:04:34嗯,希望它确实能给修复方案。
00:04:36但当你开始在真实代码库中使用它时,
00:04:38一切就变成了真正的维护工作。
00:04:41上下文变得混乱,
00:04:43智能体忘记了它已经尝试过什么。
00:04:46它修改了你根本没让它动的文件。
00:04:48你不得不不断检查它的工作。
00:04:51发生的事情是,一点一点地,
00:04:53有些恼人的事情在发生。
00:04:55你并没有摆脱工作。
00:04:58你现在成了 AI 的管理者。
00:05:00这是一份不同的工作。
00:05:02我们要跟踪任务,审查差异,
00:05:05检查测试,所有这些琐事。
00:05:06所以这只是一个新岗位。
00:05:09Ruda 为这一切提供了一个可视化看板。
00:05:12那么相比我们已经在使用的工具,
00:05:13它处于什么位置呢?
00:05:17像 Cursor 和 Claude 这类工具,它们是聊天优先,
00:05:19这倒不是坏事。
00:05:20当你想要一个真正集成的、接近代码的
00:05:23强大代码助手时,它们很棒。
00:05:25当你想要一个强大的代码助手时,它们非常棒,
00:05:28一个与我们的代码紧密结合的助手。
00:05:31Ruda 的重心有点不同。
00:05:34它是任务在交付系统中推进,
00:05:36从待办事项到测试和审查。
00:05:38现在将其与 CrewAI 或 LangGraph 等智能体框架进行对比,
00:05:41那些框架更灵活。
00:05:44但这种灵活性意味着你往往
00:05:46必须自己构建工作流。
00:05:49谁来规划?谁来实施?证据去哪里了?
00:05:51所有这些琐事。
00:05:52Ruda 是免费、本地优先且可插拔的。
00:05:55本地仓库,本地工作流,
00:05:56Ruta 是免费的、本地优先的,而且它是可插件化的。
00:05:59本地仓库、本地工作流,无需强制注册账户
00:06:02转而全部换成 Ruda。
00:06:05不,我才不会那样说。
00:06:08那根本不是事实。
00:06:09而且它也只在某些情况下好用。
00:06:10我用着还挺开心的。
00:06:12有几点我立刻就喜欢上了。
00:06:15可视化看板、清晰的任务状态,
00:06:17以及可追溯的移交,这非常棒。
00:06:19这比 300 条消息的聊天线程专业多了。
00:06:22本地优先的方法也很出色。
00:06:24很多人都厌倦了 AI 工具变成
00:06:27一种对我们的代码没有边界的订阅模式。
00:06:30能够将其保持在我们的本地工作流附近,
00:06:32这是一个真正的优势。
00:06:35我的意思是,虽然你在技术上可以
00:06:38自己实现所有这些,但 Ruda
00:06:40确实让事情更有条理,所以在我看来,
00:06:42使用 Ruda 确实加快了流程。
00:06:44看板和协议模式有一定的学习曲线。
00:06:47如果你只是想打开聊天框
00:06:49提问并粘贴答案,那这太复杂了,
00:06:52这完全不是它的定位。
00:06:53桌面应用是最好的使用方式,
00:06:56但它不会像最大的商业 AI
00:06:57那样感觉那么顺滑。
00:06:59我的意思是,Cursor 用着确实不错。
00:07:01那种界面感,对吧?
00:07:02还有 Claude Code。
00:07:05而且相比封闭工具,这里的现成
00:07:06智能体确实比较少。
00:07:07但这也正是我喜欢它这个方向的原因。
00:07:08它并不假装软件交付的
00:07:10困难部分已经消失了。
00:07:12它只是试图组织它们。
00:07:15AI 不会消失,但聊天优先的工作流
00:07:17已经开始显现其局限性了。
00:07:19下一步不仅仅是更聪明的模型,
00:07:20而是更好的协调、更好的追踪记录、
00:07:22更好的关卡。
00:07:24如果你喜欢这类编码工具,
00:07:27请一定要订阅 Better Stack 频道。
00:07:29我们下期视频见。
00:07:30如果你喜欢这类编程工具,
00:07:32请务必订阅 Better Stack 频道。
00:07:34我们下期视频见。

Key Takeaway

Ruda 将 AI 辅助编程从混乱的聊天会话转变为结构化的看板交付流水线,通过可视化任务状态和可追溯的执行记录解决 AI 管理效率问题。

Highlights

  • Ruda 是一款开源、本地优先的 AI 编码工具,旨在将 AI 智能体的工作流程转化为类似 CI/CD 的交付管道。

  • 该工具通过可视化看板取代聊天记录,能够自动管理开发、审查、测试及验收标准等阶段。

  • 用户可通过 Docker 自托管该应用,并能根据需求灵活连接 Anthropic 等各类 AI 模型 API。

  • 相较于以聊天为核心的 Cursor 等工具,Ruda 专注于任务的可追溯性和交付流程的结构化管理。

  • 该平台支持 MCP 和 ACP 等智能体协议,使开发者能够协调不同智能体分别处理规划、编码和审查工作。

Timeline

AI 开发工作流的痛点

  • AI 编码工具目前普遍面临聊天记录无法追溯、缺乏项目进度管理以及缺乏质量控制关卡的难题。
  • 软件开发不仅是生成代码,更是一个包含任务定义、交付、测试和验收的完整系统。

目前的 AI 编程模式将大量关键信息和方案锁定在难以管理的聊天线程中。由于缺乏可追溯性,开发者无法清晰了解 AI 的尝试路径及背后的证据支撑。此外,测试与验收标准往往被忽视,导致 AI 产生的代码难以直接投入生产。

Ruda 的看板式交付系统

  • Ruda 引入了 CI/CD 思维,将任务划分为待办事项、开发中、审查和验收阶段。
  • 工作区允许用户连接真实代码仓库,并利用可视化看板追踪智能体的实时工作状态。

通过将 AI 编码任务置于看板中,任务拥有了清晰的归属地。用户可以直观地观察智能体在不同开发阶段的输出结果,并随时查看任务的修改内容和证据。这种方式将零散的聊天对话转变为可视化的流水线作业。

架构理念与应用定位

  • Ruda 的核心在于作为协调多个智能体的基础设施,通过支持 MCP 和 ACP 协议实现插件化功能。
  • 该工具适用于需要结构化流程和本地部署的高级开发者,而非仅仅寻求快速生成代码的场景。
  • 相较于 Cursor 的聊天优先体验,Ruda 更强调对开发流程的组织与质量控制。

Ruda 不试图模仿封闭式 AI 工具的顺滑交互界面,而是专注于解决软件交付过程中的组织问题。它允许用户连接自定义的 AI 模型和智能体,将原本需要人工维护的琐碎任务交给自动化的交付流。尽管其学习曲线较陡,但在保持代码库本地化和工作流条理化方面具有显著优势。

Community Posts

No posts yet. Be the first to write about this video!

Write about this video