9:07AI LABS
Log in to leave a comment
No posts yet
在单个 AI 聊天窗口中输入“帮我做一个精美的落地页”并按下回车。结果显而易见:你会得到一个看起来似曾相识的设计,以及充斥着面条代码(Spaghetti Code)的产物。在 2026 年的今天,仅靠与 AI 简单的对话水平,已经无法实现专业级的 UI/UX。
现在的时代,工具的组合——即**智能体编排(Agent Orchestration)**决定了设计的质量。本文将探讨如何将 Google 的 Stitch MCP、Claude Code 以及 Vercel Agent Browser 串联在一起,构建从策划到自动验证的端到端战略。
许多开发者犯的错误是不经过策划就直接进入代码生成环节。这会暴露 AI 的设计偏见,从而降低产出质量。我们应该像架构师一样利用 Claude Code 的 Plan Mode 来防止这种情况。
通过 Shift + Tab + Tab 进入的 Plan Mode 不仅仅是一个只读模式。它是分析项目并完成逻辑设计的控制塔。在实际工作中,必须经过以下序列:
在此阶段生成的 CLAUDE.md 将成为智能体时刻参考的基准点。只要在这里正确写入类似 Kebab-case 的命名规则,就能防止 80% 以上 AI 随意编写代码导致的事故。
策划完成后,就该轮到绘制实际 UI 了。这里的核心引擎是基于 Gemini 3 Flash 的 Stitch MCP。
根据最近的软件工程基准测试 SWE-bench Verified 数据显示,Gemini 3 Flash 创下了 78% 的准确率,超过了其上位模型 Pro (76.2%)。特别是它支持 Thinking Level 参数,优化了需要高密度思考的布局设计,而非简单的代码生成。
在实现阶段,要警惕代码堆积(Snippet Bloat)现象。为了防止 Stitch MCP 吐出数千行的单个文件,请使用 Janitor Prompt 策略。根据关注点分离原则,指示其按文件夹拆分组件并将每个文件保持在 100 行以内,AI 就会自动按照 Next.js 标准结构进行重构。
设计完成后,需要确认其是否能实际运行。过去的工具是在像素级别对比屏幕,而 Vercel Agent Browser 则利用 可访问性树 (Accessibility Tree)。
这种方式不需要直接处理像素数据,速度比以往快 5 倍以上。这是 AI 智能体能够更准确地识别浏览器内元素的秘诀。
| 指标 | Vercel Agent Browser | Playwright / Puppeteer |
|---|---|---|
| 识别技术 | 可访问性树快照 | 像素及 DOM 映射 |
| 平均测试时间 | 约 4 分钟 | 约 15~20 分钟 |
| Token 消耗量 | 约 1,400 tokens | 约 7,800 tokens 以上 |
| 变更应对力 | 优秀(以结构为中心) | 较低(依赖布局) |
例如,如果在响应式模式下发现汉堡菜单无法点击,智能体会分析可访问性树,立即发现是 z-index 错误并自动修正代码。
由于是尖端工具,初期配置可能会遇到障碍。特别是 Windows 用户,请检查以下两点:
第一,Windows 套接字错误 (EACCES)。如果出现 Daemon failed to start 错误,请以管理员权限运行终端,或使用 agent-browser connect <port> 命令手动连接。
第二,认证及配额问题。必须在 Google Cloud SDK 中设置 gcloud auth application-default set-quota-project,才能避免调用 Stitch MCP API 时发生的配额错误。
现在的 AI 不再只是单纯帮写代码的辅助工具,而是理解整个项目背景并执行任务的共同工作者 (Co-worker)。
用 Claude Code 搭建骨架,用 Stitch MCP 填充血肉,再用 Vercel Agent Browser 验证完成度。这种编排将使你的生产力提升 10 倍以上。没有技术债的洁净代码和精美设计,不再是手动操作的专属。