Log in to leave a comment
No posts yet
开启 AI Agent 驱动的编程时,最令人恐惧的不是性能,而是下个月的信用卡账单。视频中看到的双 Agent 协作虽然精彩,但如果毫无节制地使用,极易触发 API 费用炸弹。截至 2026 年,Claude 4.6 Opus 的输入单价为每百万 Token 3.00) 贵 60% 以上。输出成本甚至飙升至 $25.00。在超过 10 万 Token 的遗留项目中,循环每转动一次,就相当于消耗掉了一杯咖啡的钱。
为了控制成本,不能盲目迷信 Opus,而应采用插槽分配模式。仅在占整体工作量 20% 的设计与架构判断中部署 Opus,其余 80% 的简单实现则交给 Sonnet。
--model opus 标志手动提权。养成每周一早晨查看 API 报告的习惯,确认实际支出是否符合预期曲线。Agent 消耗的 Token 中,实际上有 70% 浪费在检索不必要的文件和遍历目录上。当上下文超过 10 万 Token 时,LLM 会出现注意力急剧下降的“性能断崖”现象。一股脑塞入所有源代码是费钱又毁性能的捷径。根据 Anthropic 的内部测试结果,通过压缩上下文进行传递,在维持推理质量的同时,输入成本可降低 50% 以上。
请创建 AI 专用的说明书 ARCH.md,为 Agent 提供指路地图。
tree -L 3 -I 'node_modules|dist|.git' > tree.md 命令提取项目骨架。接着使用类似 Repomix 的工具,剔除实际逻辑,仅保留函数签名和接口定义的“签名图 (Signature Map)”。最后在 .claudeignore 文件中明确标出 .svg、.json 等资产文件,将其从 Agent 的视线中移除。双 Agent 架构的核心在于通过分离设计者 (Advisor) 与执行者 (Executor) 来建立安全机制。如果只是简单地要求“帮我 Review 代码”,通常只会得到“代码很整洁”这种敷衍的回答。作为资深工程师,必须强制要求 Advisor 扮演“刻薄的批评者”。仅此一步,就能大幅减少每周通常需要 5 小时以上的后期 Bug 修复时间。
在执行模型改动代码前,请建立一套让 Opus 进行批判性审查的机制。
如果让 Advisor 和 Executor 串行工作,每次验证都会产生等待时间。在需要修改数百个文件的大规模重构中,这种方式效率太低。迁移 5 万行以上的库时,需要通过任务拆分进行并行编排 (Orchestration)。
提升任务速度的并行流程如下:
git worktree add 命令创建基于功能的独立目录。在每个 Worktree 中开启独立的 Claude Code 会话,同时重构不同的模块。最后使用 Clash 等工具解决 Worktree 间的冲突,并合并至主分支。随着 AI 生成的代码不断堆积,某一时刻可能会出现整体结构失调的技术债务。Agent 虽然能完美修复单个文件,但并不对系统整体的发展方向负责。2026 年,资深工程师的真正职责不再是亲手敲代码,而是管理 Agent 产出结果的对齐状态。
请在每周五下班前执行“架构审计”流程。