这种方法彻底改变了我与 AI Agent 的协作方式

AAI LABS
Computing/SoftwareSmall Business/StartupsManagementInternet Technology

Transcript

00:00:00Co-work 为非开发人员提供了强大的云端代码能力,让他们能够创建
00:00:04真正的自动化、文档工作流、流水线和研究任务,而这些在以前
00:00:10只能在终端原生运行。
00:00:11但大多数人获得的结果质量依然不高,并抱怨使用 Co-work
00:00:15一直在耗尽他们的使用额度。
00:00:17这并非工具本身的问题,而是因为在前期配置上
00:00:21没有投入足够的精力。
00:00:22前期配置并没有所谓的标准做法,它通常是一系列步骤,
00:00:26目的是让工作流完全契合你的需求。
00:00:28我知道我们在之前的很多视频中都讨论过类似的各种最佳实践,
00:00:32但我们又发现了一些效果确实很好,且能显著提升工作效率的新方法。
00:00:37在开始任何操作之前,你首先需要为每个工作文件夹
00:00:42创建一个 manifest.md 文件。
00:00:43这个文件位于文件夹的根目录,包含关于该文件夹实际结构
00:00:47和内容的指引。
00:00:48对于 Cloud Code 用户来说,这个文件等同于 claud.md 文件。
00:00:52如果你和我们一样,也在包含大量嵌套和结构化信息的
00:00:56文件夹中工作,manifest 能提供很大的帮助。
00:01:00Claude 往往会迷失方向,并从无关文件中提取干扰信息。
00:01:03这是因为如果没有 manifest 文件,Claude 倾向于在文件夹中乱逛,
00:01:07猜测正确的文件到底在哪里。
00:01:09这会不必要地增加上下文负担,导致其使用错误的文件作为来源,
00:01:14并生成低质量的输出。
00:01:15此文件会明确哪些文档是事实来源,哪些子文件夹映射到哪个领域,
00:01:20以及哪些内容可以完全跳过。
00:01:21manifest.md 包含三个层级的文件分类,让 Claude 知道
00:01:27应该重视哪些文件,而忽略哪些。
00:01:28第一层级(Tier 1)包含模型应始终加载的所有文件,它们作为事实来源,
00:01:33列出了所有绝对不能跳过的文件。
00:01:36第二层级(Tier 2)是那些你希望根据需求加载的文件。
00:01:39这些包括你现在不需要,但稍后可能会用到的文件。
00:01:43最后,第三层级(Tier 3)是存档数据,也就是你为了记录
00:01:48而保留的旧版本数据,实际并不需要。
00:01:50这就是为什么我们将其标记为“除非要求,否则忽略”。
00:01:53设置好之后,每当我们在 Co-work 中提出任何问题时,它都会首先加载
00:01:59manifest.md 文件,并从中定位包含所需数据的文件,然后
00:02:03比没有该文件时更快、更可靠地响应我们的查询。
00:02:07除了 manifest.md 之外,你还需要创建另外三个上下文文件,
00:02:12来定义你的身份。
00:02:13这些文件分别是“关于我”、“品牌风格”和“工作风格”,每个文件都解释了
00:02:19你偏好的响应方式,以便 Claude 知道该如何表现。
00:02:20这消除了平庸的 AI 输出,因为 Claude 真正了解了你的工作风格。
00:02:25我们将这些文件放在 Documents 文件夹内的 Claude Context 文件夹中,
00:02:29并通过在指令中告知 Claude,使其在任何地方都能访问到它们。
00:02:33这确保了 Claude 的响应符合我们的需求,而不会以我们
00:02:38不喜欢的方式运作。
00:02:39这些文件并不是一劳永逸的。
00:02:42它们需要经常优化,如果你发现 Claude 没有遵循你在文件中
00:02:46给出的指令,那么请与其一起迭代,判断是提示词问题
00:02:51还是上下文问题。
00:02:52无论是哪种情况,你都可以在这些文件中添加内容来修复。
00:02:54此外,你还需要创建记忆文件,这样如果你在某个特定文件夹中
00:02:59持续工作,它就能通过这些文件保留不同会话间的记忆。
00:03:03这与编程类似,让文件作为我们所有决策和待办任务的
00:03:08外部存储器。
00:03:10接下来的内容经常被人们忽视,那就是全局指令。
00:03:13许多人直接留白,但它们其实非常强大,因为这些指令
00:03:17在任何其他内容(甚至在你的提示词)之前加载。
00:03:21它们充当你所有提示词的起点。
00:03:23对于 Claude Code,这相当于主目录下 .claude 文件夹中
00:03:28claude.md 文件里的指令。
00:03:30在我的全局指令中,我特别声明 manifest.md 是 Claude
00:03:35应该首先查看的文件,并告知了它如何浏览该文件。
00:03:37除此之外,还有其他一些实践能让 Claude 的工作更易于管理。
00:03:41例如,我让 Claude 在执行任何操作前先提出澄清问题。
00:03:45这样它就不会盲目地去做它认为正确的事情,而是可以通过
00:03:48相关问题来纠正方向。
00:03:50全局设置中另一个值得包含的内容是,要求 Claude 在行动前
00:03:54展示一个简要计划。
00:03:55当它先列出计划时,你就能判断其方向是否正确。
00:03:59你还可以根据喜好添加其他规则。
00:04:00比如,我添加了避免废话和不要注水的指令,这在
00:04:05Claude 平时的输出中经常出现。
00:04:06我还明确表示,如果置信度较低,Claude 应该提问,
00:04:11而不是自信地给出错误答案。
00:04:12所有这些设置都大大提升了使用 Co-work 的体验。
00:04:16即使提示词模糊,这种配置也能让它准确回答。
00:04:19正如我提到的,我们使用上下文文件来引导语气和个性,
00:04:24所以我也将此包含在全局指令中,以便它在需要时随时参考。
00:04:28虽然你可能已经在我们的视频中听过很多次,但你仍需要
00:04:32确保提供给智能体的上下文是最简的,无论是通过提示词显式声明,
00:04:36还是通过 manifest.md 等文件进行控制。
00:04:41上下文窗口中的干扰信息越少,它的表现就越好。
00:04:44现在,提示词、安装说明和模板都已在 AI Labs Pro 中上线。
00:04:48对于还不了解的朋友,这是我们最近推出的社区,你可以在那里获得
00:04:52开箱即用的模板,直接插入本视频及以往视频中的项目中。
00:04:57如果你觉得我们的内容有价值并想支持频道,这是最好的方式,
00:05:01链接就在描述栏里。
00:05:03另一件我们需要做的事情是,定义你想要达到的最终状态,
00:05:07而不是定义过程。
00:05:09正如我们常说的,如果我们向模型展示正确的输出长什么样,
00:05:13它往往表现得更好,并朝着那个目标进行迭代。
00:05:16正确的输出可以是任何东西:测试用例、提示词中的最终结果或类似参考。
00:05:21这一原则适用于所有智能体,无论是 Co-work、Claude Code 还是其他。
00:05:26当我们想在文件夹中执行重新组织任务时,我们明确说明了
00:05:31每个文件的哪个版本该进入哪个文件夹,以及每个文件夹在
00:05:36重组完成后应包含什么,而不是含糊地让它重组文件。
00:05:40我们还详细说明了它应如何处理嵌套文件夹,并明确提到了
00:05:45它不应该碰的内容。
00:05:46这种提示词让 Claude 能以有序的方式朝着目标迭代,让任务
00:05:50变得简单得多,因为现在它知道了正确的输出是什么样的。
00:05:54我们需要明确告诉 Claude,如果它对任何任务感到不确定,该怎么做。
00:05:58通常我们在提示词中给 Claude 清晰的指令,告诉它需要做什么
00:06:03以及遵循的最佳路径,但我们没有提到它该如何处理边缘情况。
00:06:06在这些情况下,Claude 往往会靠猜,而且大多数时候都会猜错,
00:06:10因为它不知道我们的偏好方法。
00:06:12所以你需要特别声明在这些情况下它应该做什么。
00:06:16我们在全局指令中加入了这一点:如果 Claude 对任何事情不确定,
00:06:21它应该通过文字表达来询问,如果置信度低,也应该说出来。
00:06:25在文档文件夹的“工作风格”中,我们也规定了如果它对某事
00:06:30不确定,就应该说出来,绝对不要瞎猜或将其当作事实陈述。
00:06:34有了这些,Claude 会预先标记不确定性,而不是自信地给出错误答案。
00:06:39在继续之前,让我们先进一段赞助商 Scrimba 的广告。
00:06:42我们大多数人学习编程都是通过看视频,然后卡住,不断在
00:06:46浏览器和编辑器之间切换,直到大脑崩溃。
00:06:49Scrimba 解决了这个问题。
00:06:50他们创造了 Scrim 技术,视频播放器其实就是一个实时代码编辑器。
00:06:54在任何时刻,你都可以点击暂停,直接点击进入讲师的代码,
00:06:58然后在那里开始编辑,查看会发生什么。
00:07:00这就像是与专家进行结对编程,这才是让学习内容
00:07:04真正深入脑海的关键。
00:07:05Scrimba 提供掌握 AI 工程和全栈开发所需的专业培训,
00:07:09帮你打造高质量的项目组合。
00:07:11如果你是学生或正在准备面试,这些深度课程能帮你应对技术面试,
00:07:15内容涵盖数据结构和 Git。
00:07:18这是弥补“氛围编程”与专业工程之间差距最有效的方法。
00:07:22别再看那些被动式教程了,今天就开始通过交互式构建
00:07:26获取实战经验吧。
00:07:27今天就从他们的免费课程开始,当你准备好后,点击下方置顶评论
00:07:31中的链接,在他们的 Pro 计划上再省 20%。
00:07:35与其为每个任务使用不同的会话,你应该将相关工作
00:07:39合并到一个会话中。
00:07:40那么,如何识别哪些任务可以组合到一个会话中,而哪些不能呢?
00:07:45第一个线索是,某些任务实际上是共享上下文的,因为
00:07:49一个任务的输出会被用作下一个任务的输入,以此类推。
00:07:51例如,生成月度预算摘要报告通常涉及多个相互关联的
00:07:56子任务。
00:07:57在这种情况下,我们需要将类似的任务分组,这样运行起来更快、
00:08:01更便宜且质量更高。
00:08:02这也有助于防止频繁触碰会话限制,因为你用更少的会话
00:08:06完成了更多的任务。
00:08:08我们在给 Claude 提示词时,会明确以一个目标开始,然后提到
00:08:12它需要做的第一步,接着是下一步,直到达成目标。
00:08:16这种方法让我们能快得多地完成更多任务。
00:08:19然而,如果任务之间没有关联,将它们合并在一起不仅会
00:08:23浪费 Token,还可能导致输出结果错误。
00:08:26此外,任务的批量处理不一定要按顺序进行。
00:08:29如果有可以并行完成的任务,你可以通过利用并行
00:08:34智能体来集成它们。
00:08:35Claude 可以自动识别对并行的需求并自行执行。
00:08:39但在你的提示词中明确提到这一点也无妨。
00:08:42我们还大量使用子智能体来让我们的任务更快捷、更方便。
00:08:46通过子智能体,可以快速完成大量任务,而且它们专用的
00:08:50上下文窗口能防止主上下文被不必要的信息塞满。
00:08:55不过,需要注意的一点是,子智能体消耗大量 Token,因此你
00:08:59仅在绝对必要时才使用它们。
00:09:02另外,如果你喜欢我们的内容,请考虑按下 Hype 按钮,因为这能
00:09:06帮我们制作更多类似的内容并让更多人看到。
00:09:10Co-work 具有优势,因为我们可以调度任务,而以前我们通常
00:09:14需要反复给出提示词来手动完成。
00:09:15现在我们可以调度一系列每天都要执行的任务。
00:09:18这些调度任务只有在你的电脑唤醒且 Claude 桌面端开启时
00:09:23才会运行,这是一个重要的考虑因素。
00:09:24由于我们已经有一个系统全天候运行,运行 Open Claude 来研究新点子、
00:09:29追踪新工具发布并汇报到 Discord 频道,我们便让 Co-work 调度
00:09:34另一个自动化任务。
00:09:35现在我们使用调度技能,让 Claude 分析我们讨论新想法和工具发布的
00:09:39会议记录,并根据这些记录在当天的这个文件夹里
00:09:44写一份报告。
00:09:45我们还给了它一个规范的文件命名格式,并让它识别待办事项。
00:09:49针对这个提示词,Claude 询问了我们关于频率的问题,然后
00:09:54为我们调度了任务。
00:09:55现在,我们会定期收到会议记录、点子和可用工具的报告,
00:09:59这些全部源自我们的日常讨论。
00:10:02通过使用连接器链接 Gmail 或 Google Drive,这个过程还能进一步优化,
00:10:07让我们能直接写邮件或将文件存入收件箱。
00:10:11我们还可以通过在 Claude Code 中设置定时任务(cron jobs),让它
00:10:15与 MCP 工具和 CLI 交互来完成同样的工作。
00:10:18为了让工作流更高效,我们需要使用插件来复合各项能力。
00:10:22每个插件本质上都包含一系列技能或命令,以及子智能体集成,
00:10:27全部针对特定领域,并因包含定制指令而在该领域的工作中
00:10:32表现专业。
00:10:34Claude 已经内置了许多针对常见场景的插件,但我们也可以创建自己的。
00:10:38这些插件是开源的,可以在 GitHub 上找到。
00:10:41现在的插件套件甚至包含一个用来创建插件的插件。
00:10:44当我们想创建自己的插件时,只需在聊天界面提出要求,
00:10:49它就会运行构建新插件的技能。
00:10:51Claude 在会话中问了我们一系列问题,然后展示了一个计划。
00:10:55一旦我们批准了计划,它就开始构建一切。
00:10:58这让过程变得更加简单,因为现在我们不必依赖别人构建的
00:11:02插件,我们可以根据自己独特的使用场景创建专属插件。
00:11:07另一件值得一提的是使用技能(Skills)。
00:11:09我们已经详细讨论过如何构建一个好的技能,并带你走过
00:11:13创建新技能的过程,包括如何处理我们在构建过程中
00:11:17遇到的问题。
00:11:18你可以在我们的频道上查看这些指南,它们会在你构建
00:11:22自己的技能时提供帮助。
00:11:23Claude 还附带了许多针对常用任务的内置技能,但我们也可以
00:11:27针对自己独特的使用场景创建自定义技能。
00:11:31最后,我们必须把 Co-work 当作一名员工,而不是玩具。
00:11:35Co-work 仍处于研究预览阶段,安全限制有限,这意味着如果不妥善
00:11:39加以限制,它可能会修改不该修改的内容。
00:11:42我们需要给它清晰的界限,以充分发挥其作用。
00:11:45敏感数据应存放在单独的文件夹中,仅暴露实际需要的部分,确保
00:11:49Co-work 不会触及私密信息。
00:11:52我们还需要严格限定其任务范围,以确保良好的性能。
00:11:56例如,添加“不要删除任何东西”之类的指令,可确保它不会
00:12:00删除文件,并会在必要时询问后再移除内容,就像我们
00:12:04之前在提示它时所做的那样。
00:12:05还存在提示词注入的风险。
00:12:07如果文档或网站包含有害指令,Co-work 可能会执行它们并引发问题。
00:12:12此外,Co-work 比普通聊天使用更多的资源,所以如果你过度使用,
00:12:17你的上下文限制将很快达到上限。
00:12:19你需要谨慎地驾驭它,以从中获得最大收益。
00:12:22本视频到此结束。
00:12:23如果你想支持本频道并帮助我们继续制作此类视频,你可以
00:12:27通过下方的 Super Thanks 按钮来实现。
00:12:30一如既往,感谢观看,我们下期再见。

Key Takeaway

通过在前期配置上投入精力,建立结构化的上下文文件和清晰的全局指令,可以彻底改变与 AI Agent 的协作效率并显著提升输出质量。

Highlights

通过在文件夹根目录创建 manifest.md 文件,为 AI 提供结构化指引,防止其在无关文件中迷失。

建立“关于我”、“品牌风格”和“工作风格”三个核心上下文文件,确保 AI 响应符合个人偏好。

充分利用全局指令(Global Instructions),在所有任务开始前设定 AI 的行为准则和澄清机制。

将相关任务合并到单个会话中,并通过子智能体和并行处理提高效率并节省 Token。

利用 Co-work 的调度功能和定时任务(cron jobs),实现会议记录分析、报告生成等自动化流程。

像对待员工而非玩具一样对待 AI,通过设置明确的边界和权限来管理安全风险和数据隐私。

Timeline

引言与 Manifest 文件的核心作用

视频开篇介绍了 Co-work 为非开发人员带来的强大云端代码能力,但也指出许多用户因配置不足而导致结果质量低下。演讲者强调了在每个文件夹根目录创建 manifest.md 文件的重要性,该文件类似于 Claude Code 中的 claude.md。它通过三个层级对文件进行分类,明确哪些是事实来源,哪些可以根据需求加载,哪些应被忽略。这种做法能显著减轻 AI 的上下文负担,防止其从无关文件中提取干扰信息。有了这个文件,AI 能够更快、更可靠地响应查询,避免在文件夹中“乱逛”。

建立个人身份上下文与全局指令

除了结构文件外,用户还需创建“关于我”、“品牌风格”和“工作风格”三个文件来定义个人偏好。这些文件被存放在特定目录中,通过指令让 AI 在任何地方都能访问,从而消除平庸的输出。演讲者还深入探讨了全局指令的威力,建议将其作为所有提示词的起点。在全局设置中,可以要求 AI 在行动前展示计划、提出澄清问题,并明确“不要注水”或“低置信度时提问”等规则。通过这种方式,即使提示词模糊,AI 也能准确执行任务。最后,他再次强调保持上下文最简是提升性能的关键。

定义目标状态与任务的高效处理

这一章节重点讨论了如何通过定义“最终状态”而非“过程”来引导 AI。演讲者建议向模型展示正确的输出样例,如测试用例或参考结果,这比含糊的指令更有效。在处理复杂任务时,应明确说明哪些内容不应触碰,以及如何处理嵌套文件夹。此外,针对 AI 可能遇到的不确定情况或边缘案例,必须在全局指令中预设应对方案。通过要求 AI 预先标记不确定性而非瞎猜,可以有效避免自信的错误答案。这种策略不仅适用于重组任务,也适用于所有类型的智能体协作。

Scrimba 赞助与交互式编程学习

视频中间穿插了对 Scrimba 的介绍,这是一家专注于交互式编程教育的平台。传统的视频教程往往让学习者在浏览器和编辑器之间反复切换,导致效率低下且容易疲劳。Scrimba 开发的 Scrim 技术允许用户随时暂停视频并直接在讲师的代码中进行编辑和实验。这种“结对编程”式的体验有助于让学习内容更深入脑海,并弥补“氛围编程”与专业工程之间的差距。平台提供了涵盖全栈开发、AI 工程和数据结构等深度课程,适合想要构建项目组合或准备面试的学生。点击特定链接还可以获得 Pro 计划的额外优惠。

任务合并、并行处理与自动化调度

演讲者建议将具有共享上下文的相关任务合并到同一个会话中,以节省 Token 并防止触发限制。对于互不相关的任务则应分开处理,以免造成输出错误。视频还介绍了利用子智能体进行并行处理的方法,虽然这会消耗更多 Token,但能极大提升效率。Co-work 的一大优势在于任务调度,用户可以设定每天自动执行的任务,如分析会议记录并生成报告。通过连接 Gmail 或 Google Drive 插件,这些自动化流程可以进一步扩展到邮件发送和文件管理。此外,在 Claude Code 中设置定时任务(cron jobs)也能实现类似的高级功能。

自定义插件、技能与安全边界管理

视频最后讨论了如何通过插件和自定义技能来复合各项能力,甚至可以使用“创建插件的插件”来定制专属工具。演讲者严正提醒用户要将 AI 当作真正的员工而非玩具,特别是在其仍处于研究预览阶段时。为了保障安全,敏感数据应存放在独立文件夹中,并给 AI 设定清晰的操作界限,例如严禁未经许可删除文件。用户还需警惕提示词注入风险,因为文档或网站中的恶意指令可能会诱导 AI 执行有害操作。通过谨慎驾驭资源限制并不断迭代上下文文件,用户可以从 AI 协作中获得最大收益。视频在感谢观众支持和推荐 Super Thanks 按钮中圆满结束。

Community Posts

View all posts