零基础也能懂:Claude Code 35 个核心概念全解析

CChase AI
Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00每一天似乎都有新的 Cloud Code 功能、新的教程,或是
00:00:04另一件让你觉得落后于人的事情。如果你才刚刚开始,这会让你
00:00:09感到极其不知所措,尤其是如果你没有技术背景。但今天我将
00:00:13帮你解决这个问题,向你展示如果我今天完全从零开始,
00:00:19我会从哪些概念入手。我们将涵盖四个不同部分的 35 个概念,
00:00:25从入门必备的基础知识开始,直到超级高级的
00:00:30资深用户功能,这些你现在不需要精通,但你应该知道它们
00:00:34至少是存在的。到最后,你将拥有一个清晰的路线图,可以
00:00:39立即开始并取得实质性的进展。我们要介绍的第一个概念是
00:00:45cloud.ai Web 应用(即那种 ChatGPT 类型的界面)与 Cloud Code 本身到底有什么区别?
00:00:53嗯,这相对简单。这两个系统使用相同的大脑。我在 Cloud Code
00:01:00内部运行着 Opus 4.6。而在聊天菜单中,我也有 Opus 4.6。区别在于,
00:01:06当我使用 Cloud Code 时,这个大脑拥有了身体。它有双手,可以实际代表我
00:01:11执行操作,无论是编写代码、访问我的电子邮件,还是与我的计算机本身进行交互。
00:01:16这就是最大的区别。Cloud Code 基本上可以为我做事。现在,
00:01:22概念二关于安装 Cloud Code。对我们来说幸运的是,这相对简单。
00:01:26如果你直接搜索 Cloud Code install,它会带你到 Cloud Code 文档页面。
00:01:31我们只需将一行代码复制并粘贴到终端,或者如果你使用
00:01:37Windows,则粘贴到类似 PowerShell 的工具中。你要选择哪一个取决于你的
00:01:42操作系统。如果你使用的是 Mac OS、Linux 或 WSL,就复制这一行。如果你
00:01:47使用的是 Windows PowerShell,就复制这一行。要找到你的终端或 PowerShell,
00:01:52只需转到搜索菜单。Mac 也是一样。我在 Windows 上输入 PowerShell。它会
00:01:57给你一个像这样看起来很吓人的界面。你只需粘贴并运行此命令,然后它就会
00:02:02带你进入设置向导。非常简单。它会要求你登录,你
00:02:06将使用你的实际订阅计划。完成设置后,要实际启动 Cloud Code,
00:02:11你只需输入 "cloud"。你会看到类似这样的内容。现在我们进入
00:02:17概念三,即我们实际在哪里使用 Cloud Code?因为其实有很多选择。
00:02:22因为虽然我可以像这样在终端中使用 Cloud Code,但我也可以使用 Cloud 桌面应用。
00:02:27这也是 Cloud Code。除此之外我们还有 Co-work。那么 Co-work 呢?
00:02:32还有 Chat 呢?或者像 VS Code 这种 IDE(集成开发环境)呢?
00:02:38在这里我同样打开了终端,和刚才 PowerShell 的情况一样,
00:02:44但我有能力查看我的文件,而且这里还有另一个窗口,对吧?这一切都非常令人困惑。
00:02:48再次强调,特别是如果你不习惯这些。其实真相是,这并没有那么重要。
00:02:53说到底,功能最强大的版本是能让你在终端中工作的版本,无论是使用
00:02:58我今天将向你展示的 VS Code,还是直接使用原始终端,比如 PowerShell 之类的。
00:03:01但当你刚开始时,如果这些对你来说负担太重,而你觉得:“嘿,我只想
00:03:06在 Cloud Code 桌面应用中使用这种易于理解的界面”,或者甚至使用 Co-work,对于大多数用户来说,
00:03:11他们要做的 99% 的事情都可以在这些空间中的任何一个完成。你不会有
00:03:19任何损失。话虽如此,我确实恳请你尝试一下终端,至少在起步阶段,
00:03:23尝试一两个星期。如果在那个时间段结束后,你仍然觉得:“啊,
00:03:29这太难了,不适合我”,那就去使用其他的工具,无论是
00:03:34Cloud Code 还是 Co-work,因为你随时可以从终端转到这些工具。
00:03:38但如果你习惯了带有“防护栏”的工具,再想转向
00:03:43更强大的工具就会稍微困难一些。尽管我这么说很容易,但终端
00:03:47其实并不像看起来那么可怕,因为它说到底只是一个提示词窗口。我们只是
00:03:53在终端内部对 Cloud Code 进行提示,就像你在 Web 应用上对 ChatGPT 聊天一样。
00:03:58正如我所说,我们今天将使用 VS Code,因为我认为它是进入
00:04:03终端环境的一个简单的垫脚石。这就是所谓的 IDE,即集成开发环境。
00:04:08它本质上还是终端,但它只是一个更友好的查看方式,因为你可以看到
00:04:13左边有这个资源管理器选项卡。所以当我们开始在文件中工作时,我在文件中创建的
00:04:18所有内容都可以在这里看到并实际打开,这在视频稍后会变得更明显。
00:04:22使用 VS Code (Visual Studio Code) 是完全免费的。如果你在 Google 中搜索 VS Code
00:04:27并点击第一个链接,你就会来到这里。开源 AI 代码编辑器。你只需
00:04:32下载它,运行安装向导。基本上
00:04:37就是这样。只需搜索 VS Code,点击它,你就会来到这样一个页面。
00:04:41点击“文件”,转到“打开文件夹”,今天我们要创建一个新文件夹。
00:04:46这个文件夹就是我们工作的地方。就像你在电脑上处理任何其他项目一样。
00:04:52我要新建文件夹。我把我的命名为 "35-test"。点击它,
00:04:56选择文件夹。你会看到这样的页面。接下来,我希望你点击顶部
00:05:02三个点的按钮,点击“终端”,选择“新建终端”。现在我们的终端就在底部打开了,
00:05:08就像我们之前运行 PowerShell 时一样。现在要打开 Cloud,我只需输入 "cloud"。
00:05:13好了。Cloud Code 已经启动并运行了。那么让我们谈谈概念四,
00:05:18也就是权限。你会注意到现在底部应该是空白的。但如果我按
00:05:25Shift + Tab,你会看到一些选项弹出。所有这些东西是什么意思?嗯,这些是
00:05:30不同的权限。你可以把这些看作是安全设置,决定 Cloud 在没有你许可的情况下,
00:05:35可以和不可以对你的计算机以及文件做些什么。现在,当它是
00:05:40空白时,我们处于默认权限设置。这意味着它会明确征求你的
00:05:46许可来编辑文件。如果我打开 "Accept Edits",它将自动编辑文件而无需
00:05:50征求许可。所以这样会快一点。但如果要使用任何 Bash 命令,即
00:05:56终端命令,这意味着对你的电脑进行更改,比如下载特定的依赖项
00:06:00或程序并安装,它会征求你的许可。然后我们有“计划模式 (Plan Mode)”,
00:06:05我们稍后会讨论。实际上还有第三种权限。但要做到这一点,
00:06:09你需要以特定的方式打开 Cloud。如果我们输入 "/exit",就可以退出 Cloud Code。
00:06:14现在如果我输入 "cloud --dangerously-skip-permissions",
00:06:20它会正常打开 Cloud,但你会在这里看到一个新设置,叫做 "Bypass Permissions On"。
00:06:26这意味着它可以编辑文件、删除文件、下载东西,所有这些都不需要我的许可。
00:06:33起初可能有点吓人,但随着时间的推移,你会明白大多数人最终都会停留在这种模式,因为
00:06:38它确实更快。我要说的是,我从未遇到过 Cloud Code 删除任何我没
00:06:44让它删除的文件的情况。虽然总会有那些传闻,但总的来说,
00:06:49一旦你习惯了,这会为你节省大量时间。但如果你对此还不放心,
00:06:54不想让它乱来,就保持在 "Accept Edits On"。现在,如果你按几次 Shift + Tab,
00:06:57就会带我们进入“计划模式”,这是我们在核心基础部分要涵盖的最后一个概念。
00:07:01计划模式意味着当我告诉 Cloud Code 做某事时,比如“让我们建立一个网站”,
00:07:06它不会直接自己跑去开干。它实际上会先思考。
00:07:11它会先想出一系列我们需要执行的步骤。你可能会在这里
00:07:18看到它会带着一些问题回来找我们。它本质上是在反向提示我们,
00:07:23以便更好地了解我们想要构建什么。所以计划模式是你从 Cloud Code 获得
00:07:28更好输出的首要方式,因为它会确保你的提示词不烂。你提出来的
00:07:35提示词肯定会有很多漏洞,而计划模式只是填补了这些漏洞,
00:07:39因为 Cloud 会提出问题来做到这一点。所以它在问我们网站的类型。
00:07:44我们会说是登录页。它在问我们的技术栈。如果我不知道,我们就选
00:07:49第一个。至于我们的目的,我们会说这是一个个人项目,然后提交。
00:07:56我想花点时间谈谈我的 Cloud Code 大师课,因为它是
00:08:04从零过渡到 AI 开发者的最佳途径,尤其是如果你没有技术背景的话。
00:08:08本课程中的所有内容都是为初学者准备的,我们专注于真实用例,帮助你学习如何
00:08:13掌握这款神奇的 AI 工具。我每周都会发布新的更新。如果你想
00:08:20获取它,只需前往 Chase AI Plus,置顶评论中有一个链接。现在正是
00:08:25讨论概念六的最佳时机,即你在规划阶段使用 Cloud Code 时的心态。
00:08:30现在它又问了我几个关于网站的问题。
00:08:35我们说我们想为这个名为 Argus 的虚假在线应用制作网页,这是一个社交媒体
00:08:40智能应用。它将为我们创建这个登录页。但说到心态,
00:08:46你需要开始将 Cloud Code 视为一名协作者。这在
00:08:51规划阶段很容易做到,因为你们有这种来回沟通,但人们容易被难住的地方正是这种来回。
00:08:57他们只会照搬 Cloud Code 说的一切,而不会向它
00:09:01提出疑问。我们之前做的一个错误的例子是,当它问我们
00:09:06想使用什么技术栈时,我们直接说:“嘿,我们要用 Next.js 和 Tailwind。”
00:09:11你知道 Next.js 和 Tailwind 是什么吗?如果你以前从未做过类似的事情,可能
00:09:15并不知道。通常情况下,Cloud Code 会给你一个建议,而跟随它是最好的选择。
00:09:20但如果你真的想学习 Cloud Code 并理解使用 AI 构建的基础,
00:09:26那时你就需要停下来,让 Cloud Code 向你解释这些概念。这样
00:09:31你才会真正学到东西,而不仅仅是一个随波逐流的“氛围程序员 (Vibe Coder)”,因为
00:09:37你必须问自己,如果构建东西这么简单,你和那个我随时可以替换掉你的
00:09:42路人甲有什么区别?因为他也可以问同样的问题,然后只管点击
00:09:48“接受、接受、接受”,给我建个登录页。让你脱颖而出并
00:09:51真正从基础上建立技能的方法,就是让 Cloud Code 为你解释
00:09:55这些事情。它是无限耐心的导师,我们需要这样对待它。这是 Cloud Code 为
00:10:00我们的登录页制定的计划。这就是你使用计划模式时可以期待的内容。
00:10:06在实际执行之前,它会给你一个关于它计划做什么的非常详细的提纲。
00:10:10你会在这里看到一些选项。你会看到 "Yes, and bypass permissions",这意味着
00:10:15它将运行它计划的内容,并且不会征求许可。"Yes, manually approve edits"。
00:10:20它将开始创建内容,但每当它想要
00:10:25创建或编辑文件时都会征求你的许可,这非常烦人。然后我们有这个,"No, refine with ultra plan"。
00:10:29Ultra 计划将在第四部分讨论,那时我们会深入研究一些资深用户功能,以及 Cloud Code 的一些
00:10:34高级功能。但现在,我们只说 "Yes, bypass permissions"。
00:10:39就这样,它开始为我们构建网站了。
00:10:43你在左边看到的这些就是它正在构建的所有文件。这就是 VS Code 的好处,
00:10:46特别是当你刚开始时。所有正在构建的内容都
00:10:50就在这里。这和我实际进入文件资源管理器,打开 "35-test" 文件夹并
00:10:55查看里面的内容是一样的。我会看到同样的东西。Cloud Code 创建的文件之一是
00:11:01你在左边看到的 "clod.md" 文件。这就是我们要讨论的
00:11:05概念七。那么 "clod.md" 文件是什么?嗯,这将存在于每一个
00:11:10Cloud Code 创建的项目中,可以把它看作是 Cloud Code 针对该特定
00:11:16项目的说明手册。这是在告诉 Cloud Code 某些
00:11:21惯例和规则。你希望它在这个特定文件夹中工作时始终遵循这些规则。
00:11:26Cloud Code 在构建你的项目时会自动创建这个文件。所以你
00:11:32不需要过多接触它,但要明白关于 "clod.md" 有很多技巧。有些人像我一样
00:11:36认为“少即是多”。另一些人则说,要把你认为相关的、且属于条框之外的
00:11:41规则尽可能多地放在这里。在开始阶段,你只需要理解这个文件的存在,
00:11:46而且无论你在里面放了什么,Cloud Code 每次在你让它做任何事情时都会引用它。
00:11:50所以它是一个非常强大的工具,但你要确保你放进去的内容(如果你要编辑的话)
00:11:56确实重要,并且几乎适用于每一个提示词。Cloud Code 创建了我们的网页。它说开发服务器
00:12:02已在本地主机启动。本地主机就像一个内部网页。如果你点击这个,它会
00:12:07带你到网页,我现在是在 Chrome 浏览器里,但它没有连接到互联网。
00:12:12这全是本地的。这就是它为我们构建的东西。非常丑陋。在整个视频中,
00:12:18我会给你不同的建议和技巧来实际改进它,但只需理解
00:12:22这就是它现在存在的地方。我们可以像对待普通网页一样与它进行交互。
00:12:27但在我们开始之前,让我们谈谈 Cloud Code 乃至大型语言模型最重要
00:12:31的概念之一。那就是概念八,
00:12:34上下文窗口 (Context Window)。如果我们输入 "/context",就可以看到上下文窗口。
00:12:40我们在这里看到的是我们使用了多少上下文窗口。在这个例子中,我们使用了 100 万个 Token 中的
00:12:4448,000 个。你可能会想:“Chase,这到底是什么意思?我连
00:12:51Token 是什么都不懂,更别说它的含义了。100 万个里的 5 万个。好吧,你到底在
00:12:57说什么?”Token 是大型语言模型和 Cloud Code 的通行货币。每一个
00:13:01单词就是一个 Token。所以我们在提示词中给 Cloud Code 的每一个单词,以及
00:13:06它回馈给我们的每一个单词都等于一个 Token。一个单词,一个 Token。实际情况略有不同,
00:13:12但就把这当作你的心智模型吧。它使用的所有工具调用都要消耗 Token。它生成的
00:13:17所有代码都要消耗 Token。它做的每一件事都要消耗 Token。而上下文窗口就是我们的预算。
00:13:23对于 Cloud Code,预算是 100 万个 Token。每个 AI 系统的情况都不同。那么,为什么我们
00:13:28需要关心这个呢?首先,如果我们把它填满了,我们的会话基本上就结束了,你这些年
00:13:34在使用聊天机器人时可能遇到过这种情况,它突然说:“嘿,我的空间
00:13:42不够了。”会话结束。这发生在你填满整个上下文窗口时。但
00:13:47重要的不仅仅是填满上下文窗口。还有概念九,
00:13:50也就是“上下文衰减 (Context Rot)”。这就是说,随着我向上下文窗口填入更多对话、
00:13:55给 Cloud Code 更多任务,Cloud Code 的实际效率就会下降。
00:14:01所以,我用得越多,它的表现就越差,这意味着我们需要关注
00:14:07我们的上下文窗口到了什么程度。
00:14:15特别是因为我们随时可以重置它。我几乎可以随时回到零状态。
00:14:22现在,这也是有代价的,对吧?当我使用普通的聊天机器人,比如在 clod.ai 里
00:14:27开始一个新聊天,那是很痛苦的,因为我希望它记住我们一直在谈论的所有内容。
00:14:33我希望它记住我的对话。我不想重新开始。那太糟糕了。
00:14:38但如果我重新开始,Cloud Code 的效果会更好。那我该怎么办?嗯,
00:14:42幸运的是,在 Cloud Code 中重新开始不像在聊天机器人里重新开始。它
00:14:47实际上要好得多,因为 Cloud Code 即使我重新开始(我只需通过
00:14:51输入 "/clear" 即可重置会话),Cloud Code 依然存在于这个文件夹中。它在我的
00:14:57电脑上。它是在云端的聊天机器人。每当我再次与它交谈并询问有关我的
00:15:03网站的问题时,从所有意图和目的来看,我们是否开始了新聊天并不重要,因为它
00:15:08可以直接查看代码库。它可以查看所有这些文件。它有 "clod.md"。它有能力
00:15:13像人一样进入文件夹并查看什么是什。因此,正因为
00:15:18如此,如果可以的话,我总是想重置我的上下文窗口。因为我为什么要
00:15:25为了维持一段本就可以被它记住的对话,而在 50 万个 Token 的状态下使用更差的 Cloud Code
00:15:30呢,对吧?所以经常重置几乎没有坏处。
00:15:35最重要的是,当你填满上下文窗口时,你的提示词本质上变得更贵了。你
00:15:42正在消耗更多的用量,因为每一个提示词本质上都在发送之前发生的一切。现在有一个缓存系统,
00:15:48这缓解了一些问题。但重点依然是,如果我处于第 80 万个 Token,每个提示词的成本确实比
00:15:53处于 5 万或 10 万个 Token 时更高。你看到很多人抱怨 Cloud Code 的用量。
00:15:58这不是他们抱怨的唯一原因。但在很大程度上,是因为很多人
00:16:04不知道如何正确管理他们的上下文窗口。所以他们消耗了更多用量,而且 Cloud Code 的
00:16:10效果也不太好。所以你可以看到:A,时刻关注上下文,以及 B,
00:16:13在合适的时候总是进行重置,这两点有多重要。根据经验,如果可以的话,你真的不希望超过
00:16:1820 万个 Token。当然也会有一些情况,由于某些原因,
00:16:25我就是需要一个更长的窗口。但如果你达到了 20%,你就需要问自己,
00:16:30并在下一次对话中粘贴进去。现在,大家
00:16:36说到重置,你只需做刚才在这里看到的操作,即输入 "/clear"。
00:16:42如果对话中有什么你想带入下一阶段的内容,只需让 Cloud Code 快速总结一下
00:16:47你们谈论的内容,然后你可以在下一个会话中复制粘贴它。现在,你
00:16:52在这里可以看到我的,这就是概念九,我的状态栏 (Status Line)。就在这里,
00:16:56你可以看到它显示 "35-test"。你可以看到我实际使用的模型,我还可以随时看到我的
00:17:00上下文窗口,这里显示 2%,而你的现在可能没显示。但你
00:17:06可以自己创建它,这样你就不用频繁地输入 "/context"。你只需看一眼
00:17:11下面就能知道进度,这能让你掌控全局。要做到这一点,你只需输入 "/status-line"。
00:17:16你可以自己设置,这样就不必频繁输入 forward slash context。你可以
00:17:20直接看下方就能知道当前进度,这能让你掌控全局。具体操作是
00:17:26输入 forward slash status line。然后写一段类似这样的提示词:
00:17:31“嘿,我想让你为我创建一个持久显示的动态状态栏。它需要包括”
00:17:37“我所在的文件夹、正在使用的模型以及当前的上下文窗口使用率。”一旦你这样做了,
00:17:44它就会为你创建,然后你只需要重启 Claude Code,你就会
00:17:48拥有自己的状态栏。刚才我们讲了一大堆概念:上下文、上下文窗口、
00:17:53清理功能、上下文腐烂以及状态栏。把这些结合起来,坦白说,你
00:17:59就会远超那些已经使用 Claude Code 一段时间的人,因为人们并没有
00:18:03像他们应该做的那样教条地遵守这一原则。现在我们顺便聊聊其他的斜杠
00:18:08命令,这是我们的下一个概念,那就是 rewind(回溯)。假设你
00:18:13确实执行了 slash clear。你一直非常注意确保上下文窗口尽可能干净,
00:18:17但你意识到,糟糕,我不该那么做的。我还有别的事情想做。
00:18:22那么,如果我输入 forward slash rewind,我实际上可以回到 Claude Code 之前的会话。
00:18:30我可以回到执行 forward slash clear 之前的状态,基本上就是把
00:18:35对话带回到原来的位置,或者是你打招呼时的那个对话。这也包括代码更改。
00:18:41所以,如果我们正在和 Claude Code 交流,并对我们的网站做了一些修改,
00:18:45假设我不喜欢这些修改,我可以输入 forward slash rewind。这是一种简单的
00:18:49回到过去的方法,因为它几乎拥有这些自动保存点。第 14 个概念是另一个
00:18:54你需要了解的,那就是 forward slash model。forward slash model 让我可以
00:18:59在所有不同的 Claude Code 模型之间切换。我们有 Opus 3.5、Sonnet 3.5、拥有 100 万
00:19:06上下文的 Sonnet 以及 Haiku。你该如何选择取决于你所使用的
00:19:10套餐。如果你使用的是每月 20 美元的专业版(Pro),你可能希望
00:19:14一直使用 Sonnet。如果你是 Max 5x,你可以经常使用 Opus。这取决于
00:19:20你实际的使用频率。如果你是 20x,你可以一直疯狂使用 Opus。模型选择
00:19:25取决于你的用途。这其实取决于你支付给 Anthropic 多少钱。
00:19:29至于 Haiku,你可能根本不需要使用它。它是一个
00:19:34极其便宜、几乎免费的模型。它的使用场景非常具体且小众。所以除非
00:19:41你知道自己在做什么,否则不需要尝试 Haiku。你还会注意到一些
00:19:44其他与模型相关的命令,比如 effort(思考程度)。这代表 Claude Code 投入了多少思考。它将
00:19:48默认设置为 auto(自动)。同样,这取决于使用情况,因为思考级别越高,
00:19:53消耗的 token 就越多,费用也越高。所以这取决于你的任务。现在,我想谈的
00:19:58最后一个核心概念是 Git。我们谈到了 rewind,对吧?也就是这种
00:20:05在 Claude Code 内部内置保存点的能力。其实还有另一种保存点,那就是 Git。所以
00:20:11Git 本质上是另一种类型的保存点,但它是在你的电脑上。它几乎是
00:20:16在保存你所编写代码的具体进度。我强烈建议你尽可能使用它。
00:20:22Claude Code 在处理 Git 方面非常熟练且智能。所以你只需要
00:20:28说类似“让我们 Git commit(提交)这个”的话。如果我说 Git commit,它就在保存。这在
00:20:36以后会派上用场,因为当我们开始使用 GitHub 之类的工具时,我们希望将
00:20:41代码的任何保存点推送到 GitHub 的云端。为此,你必须先
00:20:48提交代码。所以把 Git commit 想象成一个保存点。Rewind 很好,对吧?在
00:20:54Claude Code 的语境下它很棒,但随着我们变得更成熟,随着我们开始思考:“嘿,我
00:20:59最终要如何把这些代码发布到世界上?”我们就需要开始使用 Git。这是一个
00:21:04伟大的进步,它几乎是 rewind 之外的第二个保存点。这样你就可以
00:21:09更有信心,相信你的代码不会凭空消失。现在我们进入第三部分,
00:21:15也就是工具箱(Toolkit)。我们将在这里引入一些外部工具,
00:21:19比如 CLI(命令行界面)和 MCP(模型上下文协议),并介绍“技能(Skills)”,这是
00:21:25Claude Code 最强大的功能之一。而现在介绍它正合时宜,因为我们的网站太丑了。我是说,
00:21:31看看这玩意儿。简直就是 AI 垃圾的定义:枯燥、平淡、紫色的渐变。我们
00:21:37该如何修复它?当然,我们可以给出更好的提示词,但有一些工具
00:21:42可以专门在前端设计方面帮助我们。接下来的三个概念是
00:21:46技能、技能市场以及技能创建者技能。技能其实就是文本
00:21:52提示词。它们只是让 Claude Code 以特定方式执行特定任务的一种手段。我们
00:21:57现在看的是 Anthropic 官方的前端设计技能。正如你所见,
00:22:02它只是文本,没有复杂的代码,没什么疯狂的东西,就是一个文本提示词。所以前端设计
00:22:10技能和我把这一整段内容复制下来,粘贴到 Claude Code 里
00:22:15并说:“嘿,创建一个比你刚才做的更好的前端设计,并使用这些”
00:22:20“准则”是一模一样的,但我不想每次都复制粘贴。相反,我会
00:22:25直接使用前端设计技能,可以通过输入 forward slash front end design,或者直接用
00:22:31简单的自然语言说:“使用前端设计技能”。然后我再给出提示词。让我
00:22:36演示一下怎么做。首先,你需要安装前端设计技能。有
00:22:40几种方法可以实现。第一种是直接输入 slash plugin。slash plugin 会
00:22:46调出插件设计市场。我可以前往“发现插件(discover plugins)”,就像你在这里看到的。
00:22:52然后我可以搜索“front end design skill”。看到后直接选择,然后
00:22:57安装它。你可以通过切换到“已安装(installed)”栏来确认是否安装成功。
00:23:02你可以看到这里有“front end design plugin”。安装插件后,它会显示
00:23:07类似“重新加载插件(reload plugins)”的消息。你只需运行该命令即可完成
00:23:12安装。此时,该技能已安装到 Claude Code 中。Claude Code 知道
00:23:19该技能的存在。你只需要调用它。就像我说的,有几种不同的方式。你
00:23:24可以始终通过 forward slash 加上技能名称来调用,在本例中就是 front end design。
00:23:30我可以运行类似“使用前端设计技能”的命令,它就会执行。或者它足够聪明,
00:23:38如果我说:“嘿,我们正在为这个网页做前端开发,让我们做 X、Y 和 Z。”
00:23:43它聪明到能听懂那句话并意识到:“噢,我们正在做前端设计。噢,”
00:23:46“我有一个专门的技能,让我调用它。”最后,Claude Code 还聪明到能直接
00:23:51安装这些技能。如果你从 GitHub 复制这个 URL,它就在 Claude Code 官方的
00:23:58GitHub 上。我可以复制这个 URL,粘贴到 Claude Code 中并说:“嘿,我想安装这个技能。”
00:24:05“你能帮我安装吗?”它会自动编辑自己的设置来添加该技能。在
00:24:10我们实际演练并进入技能创建者技能之前,关于技能我要说的最后一件事是,
00:24:15技能可以是用户级别的,也可以是项目级别的。目前我们在 35 dash test 项目中,但
00:24:21如果我创建了另一个项目,比如为了处理我的邮件,那是我的邮件项目。
00:24:27那个项目能访问 Claude Code 技能吗?这取决于具体情况。通常是可以的。当我
00:24:33安装前端设计技能时,它会安装在用户级别。
00:24:37你就是用户,这意味着你这个用户创建的任何项目都可以访问这些技能。
00:24:42我们也有能力创建项目级别的技能。所以我可以专门为
00:24:48这个项目、这个网站创建或使用特定的技能,对吧?也许你不想让它在别处被使用。
00:24:53所以请理解你拥有这种灵活性。现在让我们开始实操。我输入了
00:24:57forward slash front end design。我说:“重新创建前端审美,使用 Anthropic 的”
00:25:02“配色方案,比如红陶色(terracotta)等,并给卡片增加一些视觉重量、阴影等。”
00:25:07“远离那种标准的 AI 垃圾设计。”让我们看看这次使用技能后的效果。
00:25:14这就是我们得到的结果。这比第一次迭代有了巨大的进步。那么,
00:25:19这完美吗?绝对不是。它看起来仍然像 AI 生成的吗?是的。但看看
00:25:26第一次迭代和第二次迭代之间的差距。这真的要归功于这个最简单的
00:25:30工具之一,这个最简单的技能,也就是前端设计技能。现在让我们
00:25:34某种重复性的任务,你就要把它转化成一项技能。当我们转
00:25:38技能创建者(Skill Creator)技能,这是我们的下一个概念。技能创建者技能之所以好,不仅是因为它
00:25:44经过训练可以创建高质量的技能,还因为它允许我们修改和改进现有技能,
00:25:49并衡量技能的表现。随着你使用 Claude Code 的时间越来越长,你会
00:25:55发现自己一直在重复做同样的事情。我们都有特定的工作流程。每当你
00:26:01识别出某种工作流程、某种重复性任务,你就想把它变成一项技能。而当我们
00:26:06要把某件事变成技能并创建自定义技能时,我们总是希望使用技能创建者工具,
00:26:11因为它实际上会告诉我们创建这项技能是否值得。
00:26:16它衡量技能表现的能力非常强大。它会自动运行 A/B 测试来观察:
00:26:22“这项技能是否比什么都不做要好?”它还允许我们测试技能的改进。
00:26:26所以,如果你编辑了一个技能,它会针对原始版本进行测试。我说测试时,
00:26:31它会运行多次测试并返回实际的可量化数据。这意义重大。
00:26:37为了使用技能创建者技能,就像前端设计技能一样,你可以
00:26:41复制这个 URL 并将其导入 Claude Code,或者你可以前往插件市场,在这里找到
00:26:46技能创建者技能,安装它,重新加载插件,然后就准备就绪了。现在让我们谈谈
00:26:51通过概念 20 和 21 可以引入 Claude Code 的一些外部工具,即 MCP
00:26:58和 CLI 工具。MCP 是一种让我们将 Claude Code 连接到某种外部程序的方式。
00:27:04Claude Code 的文档中有一整部分专门介绍 MCP 工具,并
00:27:11列出了你可以连接的工具类型,以及你需要复制粘贴到 Claude Code
00:27:16来安装它的命令。我们有类似 Linear、Hugging Face、Cloudflare、Figma、Guru、Monday、
00:27:23Notion 之类的工具。列表还在不断延长。通过在我们和这些程序(如
00:27:30Notion)之间建立 MCP 服务器,我就可以直接用自然语言对 Claude Code 说:“嘿,在
00:27:37Notion 里面执行 X、Y 和 Z。”它就会代表我们完成这些任务,就像我们亲自在
00:27:42Notion 内部手动执行这些操作一样。使用这些 MCP 工具需要几样东西。第一,你需要
00:27:48具体的命令。就像我说的,最流行的命令可以在 Claude Code 的
00:27:52官方文档中找到,你可以通过搜索“Claude Code docs MCP”或直接询问
00:27:58Claude Code 来找到它。然后你只需要复制这个命令,然后将其粘贴
00:28:02到终端中。现在,更简单的做法是直接说类似这样的话:
00:28:09“帮我设置 Notion 的 MCP 服务器。”Claude Code 会代表你完成这一切。它会
00:28:17搜索网络以找出需要运行哪些命令。然后它会回到你这里,
00:28:22并列出你需要做的事情。因为如果我要设置 Notion、PayPal、Stripe、
00:28:30或 Supabase 的 MCP,我需要凭据。这意味着我需要登录 Supabase 之类的网站,
00:28:36那里有特定的密钥,我需要将其提供给 Claude Code 或放入其设置
00:28:42文件夹中。如果你从未做过这些,听起来可能有点复杂,但猜猜谁是
00:28:47这些方面的专家?没错,就是 Claude Code。Claude Code 会字面上一步步引导你,
00:28:51比如它会说:“点击这个链接,去这个页面,复制并粘贴这个内容。”所以
00:28:58在 MCP 方面,Claude Code 会帮你完成所有的繁重工作。话虽如此,MCP 正在逐渐
00:29:04被冷落。尽管 MCP 在过去一年半左右的时间里被炒得火热,
00:29:09但它们正开始被 CLI 取代。CLI 工具是命令行界面工具。就像
00:29:17Claude Code 运行在终端中一样,这些程序也运行在终端中。正因为 Claude Code
00:29:23和这些程序都运行在终端里,它们简直是天作之合。相比之下,MCP
00:29:28有很大的开销,这意味着当你对比 MCP 和 CLI 时,MCP 往往
00:29:33速度更慢且 token 效率更低。所以对于 90% 的使用场景,如果有 CLI 可用,你就要
00:29:41优先使用它而不是 MCP。一个很好的例子是 Playwright MCP。Playwright 是一个
00:29:48如果我们把 Claude Code 连接到它,它就能帮我们执行浏览器自动化的工具。这就像是 Claude Code
00:29:52在代表我们控制浏览器、登录网站、测试功能。它非常棒。它既有 CLI
00:29:57也有 MCP。CLI 版要好得多。它的 token 效率高出约 90%。它更易于
00:30:04Claude Code 使用。它是 CLI 与 MCP 动态关系的完美案例研究。那么,我们该如何使用 CLI 呢?
00:30:10你应该已经知道我要说什么了。使用 CLI 有特定的命令。或者我们
00:30:15该怎么做?我们去问 Claude Code:“帮我设置一下这个 CLI”。现在,像 CLI 和 MCP 这种东西,
00:30:22如果你没开启“绕过权限(bypass permissions)”,也就是说你启动 Claude Code 时没有使用危险地跳过权限模式,
00:30:27它会要求你执行某些操作,可能会告诉你打开一个新的终端窗口
00:30:31并粘贴这些命令。如果你开启了绕过权限,它就会替你完成这一切。
00:30:35现在,这部分听起来有点吓人,对吧?Claude Code 在我的电脑上下载东西、
00:30:40安装它、运行它,令人惊恐。然而,如果你使用的是相当流行的 CLI,也就是
00:30:47经过社区验证的工具,你就不必太担心。Playwright CLI 就是一个很好的例子。
00:30:51那么问题就变成了:我应该使用哪些 CLI?事实是,
00:30:57我无法告诉你应该使用哪些 CLI。这完全取决于你的使用场景。你需要浏览器自动化吗?
00:31:03也许。你需要像 Supabase 这样的工具来进行身份验证,为你的网站设置登录功能吗?
00:31:08也许需要,也许不需要。这里有一个陷阱,很多人在听说
00:31:15CLI 和 MCP 后都会陷入其中:他们会钻进牛角尖,去搜遍每一个可能用到的 CLI、
00:31:20每一个可能相关的 MCP,把它们全部安装并疯狂使用。
00:31:25至少在我看来,对于 Claude Code 而言,少即是多。随着时间的推移,你会
00:31:32接触到其中一些 CLI 和 MCP,什么时候该使用它们就会变得非常显而易见。
00:31:37如果你才刚刚开始,我认为知道 CLI 和 MCP 的存在就足够了。更
00:31:44重要的是,知道我们可以让 Claude Code 为我们安装并使用它们。甚至在很多情况下,
00:31:50还能创建帮助 Claude Code 使用它们的技能。如果你只知道这些,对处于
00:31:56旅程初期的你来说已经足够了。如果你稍微更有经验一些,那么
00:32:00这只是更多地使用 Claude Code,并询问 Claude Code:“这个使用场景是否存在 MCP?”
00:32:06“这个场景有 CLI 吗?噢,对了,Claude Code,去用你的联网搜索功能”
00:32:12“帮我确认一下。”因为这些东西一直在变化。每天都有
00:32:17新的 CLI 发布。每天都有新的 MCP 问世。所以我不会坐在这里
00:32:21给你列出“你需要知道的 30 个工具”,尽管我确实有一些涉及这些内容的作品。
00:32:26你只需要理解它们就在那里,并且 Claude Code 可以找到它们、
00:32:31安装它们并为你使用它们。这些就是 Claude Code 所拥有的“超能力”。
00:32:36因为我想在概念 22 中谈谈“少样本提示(few shot prompting)”的想法。什么是
00:32:43少样本提示?少样本提示的想法是,当我向 Claude Code 发出提示词时,比如关于前端
00:32:50设计,我不只是给它一个提示词。我不只是给它一个技能。事实上,我要给它
00:32:55多个关于我想让它做什么的例子,以便更好地获得我想要的输出。当我们讨论
00:33:02前端设计之类的事情时,我们能做的不仅仅是提供截图。我们可以给它实际的
00:33:07代码,也就是底层的实际 HTML,Claude Code 可以利用它来更好地达到
00:33:14我们的目标。那么,这是什么意思呢?嗯,我们最初告诉我们的网页,
00:33:17我们想要某种 Anthropic 风格的配色和设计。首先,我可以把我
00:33:23想要的效果截图。让我们添加一些这些卡片。让我们截取页脚,但我们还
00:33:29可以查看实际的代码。如果我按下 control U,这里显示的就是 HTML。如果我接着复制
00:33:39所有这些并将其导入 Claude Code,这本质上就是一种少样本提示的形式,
00:33:45我通过截图加上代码来更好地引导 Claude Code 得到我想要的东西。这对于
00:33:50前端设计来说非常完美。所以我说:“我们能不能让前端更好地匹配 Anthropic 的审美?”
00:33:56“这是他们网站的 HTML 加上截图。”我粘贴了所有的 HTML,大约有 2000 行,
00:34:01然后我把截图拖拽了进去。让我们看看效果如何。这就是它
00:34:06返回的结果。在颜色方面,它确实更有 Anthropic 的感觉了。那么,
00:34:13它是完全的一比一复制吗?是否还有很多工作要做?是的。就像之前
00:34:18使用前端设计工具一样。但重点在于,通过使用少样本提示这类技巧,你对
00:34:23输出结果有了更多的控制。任何能让我们摆脱单纯“全凭运气”的提示方式,并
00:34:30让我们觉得对输出结果有掌控感的方法,都是意义重大的。而少样本提示就是
00:34:37实现这一点的最佳方式之一。但当我们自己
00:34:42不是程序员,却让 Claude Code 编写代码时,问题在于我们实际上不知道
00:34:48Claude Code 创建的东西是否正确或妥当。我的意思是,我可以看输出结果并根据最终效果来判断。
00:34:54但它在底层创建的东西到底对不对呢?它可能完全是胡言乱语。而对于我们大多数人来说,我们根本无从知晓。
00:34:58这就引出了我们的下一个概念,即对抗式提示(adversarial prompting)和对抗式代码审查。
00:35:05现在,对抗式代码审查的意思就是:检查代码并告诉我哪里出了错。现在,
00:35:13当你这样做时,有几件事需要记住。首先是这个想法:
00:35:18AI 总体上——Opus 和 Sonnet 也在这个范畴内——对它们自己写的
00:35:24代码比较宽容。无论它们创建了什么,它们都觉得那很好。所以如果我告诉它:“嘿,看下这段代码并”
00:35:29“告诉我哪里错了”,它可能会挑出几样东西,但总的来说,它会觉得
00:35:35自己做的是正确的。这其实并不令人意外。所以如果我想确保我
00:35:39写的东西是正确的,通常有两种选择。第一种是我可以再开一个终端,并
00:35:46我再次启动了 Cloud Code。这样我就在两个终端中运行了 Cloud Code,
00:35:51并拥有一个不同的 Cloud Code 会话。查看我们在这个代码库中创建的代码。
00:35:56我告诉它要具有对抗性。我告诉它要用敏锐的眼光去审视。我告诉它:“嘿,”
00:36:01“想象你是 Reddit 上某个讨厌 AI 的书呆子,告诉我这个代码库有什么问题”,对吧?这是第一种方法。
00:36:05第二种方法是使用完全不同的 AI 来进行代码审查。一个很好的方法
00:36:10是使用 Cloud Code 的 Codex 插件。OpenAI,也就是 ChatGPT 的开发者,
00:36:16Codex 的开发者,为 Cloud Code 提供了一个插件。如果你支付每月 20 美元的 ChatGPT 订阅费,
00:36:22就可以使用这个插件。事实上,你也可以免费使用,但我相信模型
00:36:26级别会降低,但我们可以像安装技能一样安装它,并让 Codex 审查
00:36:34我们的代码。他们有一个专门用于对抗性审查的命令。所以如果你是那种
00:36:39觉得“我就是不相信 Opus 所说的,我想要第二双不属于 Opus 的眼睛”的人,
00:36:44那么 Codex 插件就完美了。如何安装?非常简单。复制这个 URL,粘贴
00:36:50到 Cloud Code 中并说:“嘿,我想安装 Codex 插件”,它就会引导你完成。然后
00:36:55你只需输入 /codex review 或 /codex adversarial review。我认为
00:37:00这非常重要,特别是当你正在做一些更复杂的事情时,你知道,
00:37:04我们在这里做的是前端,比如一个落地页。它能搞砸的地方有限,
00:37:10但项目越复杂、规模越大,你就越能从
00:37:15对抗性审查中获益。这非常棒,特别特别特别是如果你
00:37:20没有技术背景,不知道它构建了什么。所以你至少需要
00:37:25一个知道发生了什么的人,也就是另一个模型,来告诉你它好不好。现在我们
00:37:32进入第四部分,高级用户部分。到目前为止我们讨论的所有内容,都是你应该
00:37:37在头几周内努力掌握的。如果你能熟练掌握
00:37:41到目前为止的所有内容,你将远远领先于普通的 Cloud Code 用户。我们
00:37:46现在要讨论的一切,更多是针对高级用户,针对更有经验的人。
00:37:52你不需要马上开始实施这些东西,但你需要知道它们的存在,
00:37:55因为随着你经验的增加,你最终会遇到一些瓶颈。这里
00:38:00向你展示的一些内容可以帮助你。所以只要知道它们在那儿,知道在
00:38:04我们称之为 Cloud Code 基础或核心的内容之外还有其他可能性。前
00:38:11两个概念都与自定义命令、自定义斜杠命令有关。所以
00:38:15当我输入斜杠时,正如你此时所意识到的,有很多命令会
00:38:22提示 Cloud Code 执行某些操作,比如 clear,对吧?我们在讨论上下文
00:38:26腐化和开始新会话时谈到过,但我们可以创建自己的。通常它们是以
00:38:32技能的形式存在的。所以你可以使用自定义技能创建器来创建技能,并使用斜杠
00:38:38命令来调用它们。我最常用的一个叫 YT-Pipeline。这是我针对 YouTube 的自定义技能
00:38:46研究工作流,因为 Cloud Code 中的技能不只是简单的东西,比如一个
00:38:52前端设计文本提示,说:“嘿,当我们创建前端设计时,确保你执行 X、Y”
00:38:56“和 Z。”自定义技能、自定义斜杠命令可以是工作流。它们可以是告诉
00:39:01Cloud Code,“我想要你先做 A,然后做 B,然后做 C,接着做 D”。
00:39:06它变得像是一种自动化。这就是我的自定义技能所做的。它使用了子技能。所以它是一个
00:39:13调用其下方其他技能的高阶技能。它还使用 CLI 等工具。所以你的
00:39:18自定义斜杠命令、自定义技能、自定义工作流可以非常复杂,
00:39:22但它们可以为你节省大量时间。就像我说的,这使用了 NotebookLM 的 API。它会访问 YouTube。
00:39:28它能够通过 Cloud Code 使用 NotebookLM 实际应用来帮我做研究。所以
00:39:36无论你做什么,只要有多个步骤且你每天都要做多次,你就应该把它变成
00:39:41自定义斜杠命令。自定义命令也可以是钩子(hooks)。Cloud Code 内部的钩子
00:39:46告诉 Cloud Code 在特定命令之前或之后执行某些操作。这些可以
00:39:53极大提升生产力。我最喜欢的钩子是每当完成一个
00:40:00命令时都会播放声音的钩子。你可能在视频中听不到,但每当 Cloud Code 完成
00:40:04一个命令,我都会听到声音。那么,为什么要这样做呢?随着时间的推移你会意识到,
00:40:10特别是当你打开多个终端,或者它在运行一项长任务,而你有点
00:40:15忘记了它,发现自己在中间刷短视频时。有一些
00:40:19声音提示来告诉你“嘿,我完成了,回来工作吧”是很棒的。如果我是你,我绝对会这么做。
00:40:25创建这些东西非常简单。你只需要说:“创建一个自定义钩子”或“创建一个”
00:40:31“在 Cloud Code 完成任务时播放声音的钩子”。就这么简单。而且你
00:40:39可以让那个钩子执行任何操作。不一定要播放声音。如果你愿意,它甚至可以每当
00:40:43完成任务时给你发封邮件。对吧?Cloud Code 是无限可定制的,自定义斜杠命令
00:40:48和自定义钩子是利用这一点的好方法。现在,我们要讨论的下一个概念
00:40:53是关于子代理(sub agents)和代理团队(agent teams)的。当你在 Cloud Code 中工作时,
00:40:59它随时可以自主地生成子代理来代表它执行任务。让我们想象
00:41:07我正在研究关于 Cloud Code 技能的内容,我想让它去互联网上
00:41:14为我寻找关于 Cloud Code 技能的信息。好吧,它可以启动一个子代理。它所做的只是
00:41:20网络搜索。所以 Cloud Code 实际上是在创建第二个 Cloud Code 实例。就像你
00:41:26创建第二个终端一样,它告诉那个子版本的 Cloud Code:“嘿,帮我去搜一下网。”
00:41:32它可以针对它想要的任何数量的任务执行此操作。有时它会创建多个
00:41:38子代理,同时执行多项任务。你作为人类并不直接与
00:41:44这些子代理交互,它们有特定的任务。它们完成任务,然后将
00:41:49信息带回主 Cloud Code 实例。现在,你有能力自己创建子代理,
00:41:54但大多数情况下,Cloud Code 在需要时会自动完成这一切。你
00:41:58只需要从理论上理解它的工作原理,因为你自己创建子代理
00:42:02有点浪费时间。但这个系统也有一些缺点。假设我告诉 Cloud Code
00:42:06去创建一个比我们一直在做的更复杂的网页。于是它自己创建了三个
00:42:11子代理。它为一个子代理分配了前端设计——就是我们一直在做的。它创建了
00:42:16另一个负责身份验证(比如登录页面)的子代理,又创建了另一个负责支付(
00:42:23比如 Stripe)的子代理。问题是这些家伙彼此不交流。前端设计不
00:42:28跟身份验证沟通。身份验证不跟支付沟通,这可能会成为一个问题,因为
00:42:32我们都试图保持步调一致。然而,在标准的子代理模式下,
00:42:39它们都在各自的孤岛中。它们做自己的事,然后回到主 Cloud Code 会话。然后
00:42:44主会话必须弄清楚一切是否真的匹配。于是代理团队(agent teams)出现了,
00:42:51代理团队与之相似,Cloud Code 也会生成这些子代理。然而,它们现在会
00:42:58彼此交谈。所以前端设计可以跟身份验证沟通。身份验证可以跟
00:43:06支付沟通。支付可以跟前端设计沟通,而且通常它实际上会生成一个额外的
00:43:12子代理,其全部工作就是协调这三个人正在做的事情,对吧?有点
00:43:19像是一个团队的中层经理。它试图模拟真实的人类团队设置,这意味着你的
00:43:24主 Cloud Code 不需要自己协调所有事情。一切都在
00:43:29子代理级别完成。这很棒。这比你普通的子代理设置更先进。
00:43:35然而,这并不是免费的,因为为了让这三个人
00:43:40彼此交谈,需要消耗更多的 token。此外,这是一项实验性功能。
00:43:46我说的实验性功能是什么意思?我的意思是,你需要在你的 settings.json 中
00:43:50显式启用它。如何做到这一点?你可以转到 .cloud 文件并自己编辑,
00:43:55或者,你知道我要说什么,复制这个页面或 URL,进入 Cloud Code 并
00:44:01让 Cloud Code 代表你启用代理团队。一旦启用,要实际使用代理
00:44:06团队,你需要明确告诉 Cloud Code。你想使用代理团队。在他们的这个例子中,
00:44:12他们说“创建一个代理团队”。所以它不会自动执行。无论你怎么说,
00:44:17你都必须说“创建一个代理团队”。让我们看看实际效果。我们会说:“创建一个”
00:44:21“代理团队来开发这个网页,一个代理负责前端设计,一个代理创建一个表单”
00:44:26“提交给想要加入我们时事通讯的人,还有一个代理为博客引擎研究想法。”
00:44:30再次强调,你需要说清楚。你可以在这里看到它创建的代理团队。它
00:44:35有一个前端设计师展示其任务,时事通讯开发任务,博客研究员任务。在
00:44:43这个主 Cloud Code 会话中,当子代理完成任务时,你会收到更新。在
00:44:48它们工作的同时,让我们谈谈多会话(multiple sessions)。因为我们刚才简单提到过。
00:44:52这是你可能随处可见的东西,就是有人同时开着九个终端,
00:44:57都在同一个项目上工作。这是你可以做的。我可以根据需要
00:45:02打开尽可能多的终端来运行 Cloud Code。从某种意义上说,我可以
00:45:09手动创建自己的代理团队。我可以让一个终端在这里负责前端设计,
00:45:14另一个终端负责表单等等。当谈到这些
00:45:20多会话时,有一些事情你需要考虑,主要是我们在开始时讨论代理
00:45:24团队和子代理时提到的,即:我们是否让所有 Cloud Code 都在同一张
00:45:30纸上工作,同时更改不同的内容。如果你有三个人坐在桌旁,
00:45:36都在写同一份报告,而报告就在一个记事本上,你就能预见到会遇到的问题。
00:45:41除此之外,根据个人经验,你只能同时拥有一定数量的终端
00:45:48在工作,超过这个数量你就会陷入频繁的上下文切换,这只是让你觉得
00:45:54很有生产力。你给了它很多提示,但你真的专注于任何一个特定
00:45:58任务吗?你真的在取得实质性进展吗?你真的在以任何有意义的方式前进吗?
00:46:02我认为超过两个终端,也许三个,我们就只是在瞎忙活了。
00:46:10如果你看到有人开了九个终端,这就是生产力表演。我们只是假装在
00:46:15做些什么。我们并没有真正以最高效率工作,但如果你打算走多终端
00:46:20路线并同时处理一大堆事情,你会想要解决
00:46:23我们讨论过的问题。三个人坐在桌旁写一个记事本,那是会有问题的。
00:46:27我们该如何处理?好吧,一种方法是使用 Git 工作树(worktrees)。Git 工作树
00:46:34试图解决这个问题。如果没有工作树,我们有三个人、三个代理、三个终端
00:46:39在同一个项目中工作。它们会互相覆盖工作,从而产生冲突。然而,有了工作
00:46:44树,不再是三个人挤在同一张桌子上,而是每个人都有自己的桌子和自己
00:46:50的一份文件副本。他们完成工作,最终所有的工作都会被整合。猜猜当
00:46:57我们把工作放在一起时,是谁确保一切都匹配?是 Cloud Code。要使用工作树,你会
00:47:02像往常一样打开 Cloud Code,但你会使用 worktree 标志,然后为那个工作
00:47:06树命名。比如前端设计。所以命令会是 cloud --worktree,然后是工作树的
00:47:12名称。然后你会对所有额外开启的终端重复此操作。正如你在这里看到的,
00:47:17这个叫 main,这个叫 front-end,这个叫 tests。你会并行地
00:47:23进行这些工作。最后,你会回到你的主 Cloud Code 会话并
00:47:27说:“看看这些工作树,让我们合并它们并确保代码整洁。”这是一个更
00:47:33高级的概念,特别是对于 Git。所以如果你刚开始,不要感到困惑而
00:47:37立刻开始使用这个。现在让我们谈谈另一个高级用户概念。那就是
00:47:43框架。像 GSD(Get Shit Done)这样的东西,像 BMAT,在某种程度上,还有 superpowers。
00:47:49这种理念是,GitHub 上有一些仓库,它们本质上充当了围绕
00:47:56Cloud Code 的编排层,并在一定程度上改变了 Cloud Code 工作的根本方式。它仍然是 Cloud Code。
00:48:01你仍然在终端中,但像这样的程序会改变它计划某些事情的方式,改变它
00:48:07执行的方式,改变它记录进度的方式。其理念是通过使用这些
00:48:13编排层,它们能帮助 Cloud Code 执行任务。通常它能帮助 Cloud Code 处理
00:48:20复杂的任务和复杂的项目。我的看法是,在这些
00:48:25编排层中有很多有用的东西,但你需要有一定的经验来理解它们什么时候有意义,
00:48:30因为就像 CLI 和 MCP 一样,你可能会像进到糖果店的小孩一样,
00:48:35认为你需要为了使用而使用每一个存在的编排层。好像
00:48:40你离真正掌握 Cloud Code 只差一个编排层似的。我不认为
00:48:46情况是这样的,特别是随着时间的推移。当 GSD 最初出现时,它处理
00:48:51上下文腐化等问题的方式非常出色,特别是与当时 Cloud Code 的做法相比。
00:48:55然而,GSD 和其他类似框架的许多核心优势已经开始体现在
00:49:03基础版本的 Cloud Code 中。就像 Cloud Code 现在开箱即用地支持很多这些功能。它
00:49:08不断更新,不断引入这些最佳实践。这并不是说这些框架
00:49:13不起作用。而是说,不要一开始就急着使用它们。对于 Cloud Code 来说,
00:49:20通常少即是多,只要明白你实际上在用什么。不要为了使用
00:49:26框架而使用它们。让我们谈谈下一个概念,它是触发器(triggers)和计划任务(scheduled tasks),
00:49:31这可能有点让人困惑。触发器可以有很多种形式。它只是
00:49:37当某件事发生时,我们做另一件事,有点像钩子。而计划任务则是我们希望
00:49:42Cloud Code 定期执行某些操作,即使我们不在场。当谈到计划任务时,
00:49:47我们有一些选择,这都与触发器有关。那就是循环(loop)的概念。所以
00:49:53通过 loop 命令,我可以让 Cloud Code 以一定的间隔执行任何我想要的操作。
00:49:59现在有几个注意事项。首先,它是基于会话的。所以我必须保持
00:50:03这个终端开启才能工作。其次,它有一个计时器。截至发布时最长为 7 天。他们
00:50:10最初设定的是 3 天,现在是 7 天。重点是你受到一定的限制,
00:50:14因为必须保持终端开启。所以如果我关机,循环就结束了。
00:50:18所以像循环这样的功能很适合,比如你一直在创建部署,
00:50:24并且你一直在更新你的网站,你想让一个循环每 30 分钟
00:50:29检查一次部署状态。所以它几乎像是一个微型技能,但它是高度专注的。
00:50:37但如果你想让 Cloud Code 一直执行某项操作,即使你不在场呢?
00:50:41答案是视情况而定。我们之前谈到了 Cloud Code 桌面应用。Cloud Code 桌面
00:50:47应用做得很好的一件事就是计划任务。所以如果我转到
00:50:52这里点击“Scheduled”,我可以创建一个新的计划任务,它每次都会运行,
00:50:58即使我不在场。所以我可以执行一个在云端运行的远程任务。假设,“嘿,”
00:51:04“每天早上 7 点,我希望你检查我的 GitHub 并执行 X、Y 或 Z”。它就会照做。
00:51:09它甚至可以执行本地任务。所以我可以让一个本地任务运行 Cloud Code 搜索网络,
00:51:14访问 YouTube,使用 NotebookLM 工具,帮我找到某个领域的十大热门 YouTube 视频。
00:51:21它也可以做到这一点。使用本地任务执行此操作的一个注意事项是,再次强调,
00:51:27它不是基于会话的。桌面应用每次都会创建一个新的 Cloud Code 会话,
00:51:32就像创建一个新终端一样,但我的电脑需要开机,Cloud Code 需要
00:51:37以某种形式打开。所以要明白它并不完全是无条件的计划任务,
00:51:43但 Cloud Code 确实有能力在 Windows 上创建计划任务。所以我有一个任务是运行
00:51:48GitHub API 并提取当天的热门 GitHub 仓库。每天早晨,这与
00:51:54Cloud Code、Windows、我的电脑或我的机器本身都没有直接关系,但 Cloud Code
00:51:59编写了脚本。现在我们只剩下几个概念了。其中一个我想谈谈的,
00:52:04也是开头提到的,就是 Ultra Plan。什么是 Ultra Plan?好吧,Ultra Plan 就像是
00:52:11计划模式(plan mode),但它是计划模式的超级版,并且在云端运行。所以如果我输入
00:52:16/ultraplan 并说“为我们的应用制定一个变现计划”,它会说:“嘿,”
00:52:21“你想运行 Ultra Plan 吗?”我会说好。然后它会启动一个云端的
00:52:26Cloud Code 会话。它会给我一个链接,你可以看到 Cloud Code 就像聊天应用
00:52:31一样在这里工作。Ultra Plan 有几个不同之处。第一点,这还没有完全证实,
00:52:37但根据它的工作方式,假设幕后有多个代理在
00:52:44处理这个特定的计划。所以它比你标准的 Cloud Code 计划更强大。
00:52:48你看到的第二点是,一旦它把计划交还给我们,修改它并
00:52:54给出你的反馈会更容易。这就是 Ultra Plan 给出的结果。其中一个区别是
00:52:59我可以复制任何内容并对该计划留下评论。我甚至可以给它一个表情符号
00:53:06回复,因为那是最好的编码方式,但总的来说,它为你提供了一个更好的界面。
00:53:12这就是最大的区别。在于幕后可能有更强大的代理,同样,
00:53:16尚未证实。它提供了一个不同且更易于使用的界面。而且
00:53:22对特定部分给出反馈也更容易。如果你批准计划,只需点击这里,
00:53:27批准计划,它就会报告回终端。然后你可以选择在当前
00:53:31会话中实施它,或者开始新会话。“开始新会话”只是清空对话,
00:53:36但保留计划。这样我们就得到了一个全新的上下文窗口,或者选择取消。这本周刚推出,
00:53:42所以可以预见 Ultra Plan 会有很多变化。现在我们还有最后两个概念,
00:53:46倒数第二个是远程控制(remote control)。关于如何通过手机使用 Cloud Code。
00:53:52最简单的方法就是远程控制。还有几种其他方法,主要是“通道”(channels),但我会告诉大多数人,
00:53:57远程控制最有意义。你只需通过 Cloud 的移动端 App 使用它,
00:54:01但你需要开启一个会话。所以思路是我已经开启了一个特定的会话。
00:54:05我已经正在 Cloud Code 中处理某些事情。然后我拿起手机,通过远程控制
00:54:11使用 Cloud Code Remote。这几乎就像是在串流我的终端。
00:54:18基本上,我在手机上看到的是完全相同的内容。所以在这种意义上很有用。而且如果
00:54:24由于某种原因,你的电脑关机或进入睡眠状态,一旦恢复,
00:54:28会话也会在你的手机上重新连接。最后我想谈的是寻找
00:54:34Cloud Code 的新工具。当我们在讨论 CLI 和 MCP 以及通过 Cloud Code 在 GitHub 上
00:54:39寻找它们时,我曾略微提到过,但你可以自己动手。如果你去 GitHub 的
00:54:44热门(trending)部分,这是寻找 Cloud Code 新兴工具的好地方。更好的是你可以让
00:54:51Cloud Code 每天早晨为你做这件事。就像我之前说的,Cloud Code 会把结果给我并
00:54:55分门别类。这样我就能看到 AI 相关的 GitHub 仓库。你可以看到,这就是
00:55:01今天的热门项目。星期三,我能看到过去一周推出的前 10 个仓库。我能看到
00:55:07它们的星数、主题、描述。我可以点进去。这让我能
00:55:13很好地掌握 Cloud Code 领域正在发生的事情。如果你对此很认真,
00:55:19并且总是想站在事物发展和趋势的最前沿,这是最好的方法。当然,
00:55:23并不是每一个都会让你大吃一惊,但有时你会尽早发现一些
00:55:28非常有趣的东西,你也可以按月进行过滤,不一定是按天。
00:55:32所以你可以在这里看到各种好东西,因为现在的节奏相当疯狂。
00:55:38每天都有新东西出来,真的是每天。每天都有新东西。与其等待
00:55:42别人把它送到你面前告诉你:“嘿,这是你应该尝试的东西”,为什么不直接去源头呢?
00:55:46看到什么是热门项目也很有意思。因为只要深入研究这些,
00:55:50你就可以告诉 Cloud Code:“克隆这个仓库,告诉我发生了什么。”你也会
00:55:56学到很多,因为这些仓库之所以火爆是有原因的。所以今天
00:56:00我就讲到这里。我希望这个视频能给你提供一些框架,特别是如果你刚
00:56:05起步,特别是如果你没有技术背景,不知道该从哪里开始。当谈到
00:56:11Cloud Code 时,它是一个了不起的工具。但如果你不具备那样的
00:56:15背景,它确实非常令人望而生畏,但我保证你可以搞定。你只需要知道你要
00:56:21往哪儿走。所以一如既往,请告诉我你的想法。如果你想
00:56:26参加那个大师班,记得去查看 chase AI+。除此之外,我们后会有期。
00:56:30再见。

Key Takeaway

通过在终端环境结合 Git 存盘、定期使用 /clear 管理 20 万以内的 Token 上下文,并优先调用高效率的 CLI 工具,初学者即可掌握 Claude Code 的自主开发能力。

Highlights

Claude Code 拥有操作计算机、编辑文件和访问电子邮件的能力,而 Web 应用仅限于对话交互。

终端权限设置默认为请求许可,但使用 --dangerously-skip-permissions 模式可启用自动编辑以提升操作效率。

上下文窗口上限为 100 万个 Token,超过 20 万个 Token 时会出现上下文衰减导致模型效率显著下降。

Git 提交可作为代码进度的永久保存点,其稳定性和功能性优于 Claude Code 内部的 Rewind 回溯功能。

CLI 工具在终端中的 Token 效率比 MCP 服务器高出约 90%,应作为外部集成工具的首选方案。

Ultra Plan 启动云端代理会话,提供可视化的协作界面,支持对特定计划细节进行精确反馈与评论。

Timeline

Claude Code 核心定义与安装流程

  • Claude Code 共享 Opus 4.6 核心大脑,但具备操作系统的实体交互能力。
  • 安装过程仅需在终端或 PowerShell 中复制并运行一行官方提供的配置代码。
  • 安装后的设置向导会自动处理订阅计划登录及初始环境配置。

Claude Code 与 Web 应用的核心区别在于具备执行权。Web 应用仅能提供建议,而 Claude Code 可以代表用户编写代码、管理文件和操作系统。安装时应根据 Mac OS、Linux 或 Windows 系统的差异选择对应的终端命令,安装完成后输入 cloud 即可启动。

开发环境选择与权限管理机制

  • VS Code 集成开发环境通过左侧资源管理器提供更直观的文件协作视图。
  • 默认权限设置要求手动确认每一项文件修改,而绕过模式可大幅缩短操作时间。
  • 使用 --dangerously-skip-permissions 命令启动可开启 Bypass Permissions 功能。

VS Code 是新手进入终端环境的最佳路径,因为它提供了可视化的文件目录并集成了底部终端窗口。权限设置是 Claude Code 的安全屏障,决定了模型在没有许可的情况下可以对系统进行的修改范围。尽管绕过权限模式在初期可能令人担忧,但熟练用户通常依赖此模式来提升构建速度。

计划模式与高效协作心态

  • 计划模式(Plan Mode)在执行具体任务前会生成详细步骤提纲供用户审核。
  • 协作过程中应将 Claude Code 视为无限耐心的导师并主动询问技术原理。
  • 避免成为盲目接受建议的氛围程序员,有助于真正建立技术功底。

计划模式通过反向提示(Reverse Prompting)填补原始提示词中的逻辑漏洞,确保输出质量。在构建如社交媒体智能应用登录页等项目时,用户应要求模型解释如 Next.js 或 Tailwind 等技术栈的选择依据。这种双向沟通能让用户从单纯的点击接受转变为理解底层逻辑的开发者。

上下文窗口管理与 Token 优化策略

  • 每一个单词约等于一个 Token,且所有工具调用和代码生成均消耗 Token 预算。
  • 上下文衰减意味着对话越长,模型的逻辑理解和任务执行效率越差。
  • 使用 /clear 重置会话不会丢失项目进度,因为模型依然可以读取本地代码库。

上下文窗口是 Claude Code 的核心预算,上限为 100 万个 Token。当 Token 数量堆积时,不仅会导致费用上升,还会让模型变得迟钝。建议将 Token 使用率控制在 20% 以内,并定期通过 /clear 刷新状态。通过自定义状态栏(Status Line),用户可以实时监控模型名称和当前 Token 的百分比占用情况。

斜杠命令与 Git 保存机制

  • /rewind 命令允许用户像使用撤销功能一样回溯到之前的会话或代码状态。
  • /model 命令支持在 Sonnet、Opus 和 Haiku 等不同性能等级的模型间切换。
  • Git commit 提供了独立于 AI 系统的本地代码存档,是发布项目的必要前提。

斜杠命令是控制 Claude Code 的快捷入口。Rewind 功能创建了自动保存点,适合快速纠错。模型选择则应根据用户订阅计划(如 20x 或 5x 计划)和任务复杂度来决定。Git 作为更成熟的保存机制,能够确保代码在推送到 GitHub 云端前拥有清晰的进度记录,是 AI 辅助开发向专业开发过度的标志。

技能系统与前端自动化改进

  • 技能是封装好的文本提示词,可安装到用户级别或特定项目级别。
  • 前端设计技能通过引入配色方案和视觉阴影规则,可显著提升 UI 美感。
  • 技能创建器支持 A/B 测试,能以量化数据评估自定义技能的性能表现。

当项目出现审美平淡等问题时,调用前端设计技能可优化布局和色彩,摆脱典型的 AI 生成感。用户可以通过 /plugin 市场安装官方或第三方技能,也可以将重复的工作流转化为自定义技能。技能创建器工具不仅能生成技能,还能在修改后对比原始版本,确保逻辑的持续优化。

外部扩展:MCP 与 CLI 工具对比

  • MCP 服务器用于将 Claude Code 连接至 Notion、Linear 或 Figma 等外部应用。
  • CLI 工具直接运行在终端中,其速度和 Token 效率显著优于 MCP 方案。
  • Playwright CLI 等工具可为 Claude Code 提供浏览器自动化和网站测试能力。

MCP 曾是连接外部系统的标准方式,但其高昂的 Token 开销和较慢的速度正使其被 CLI 工具取代。对于大多数场景,只要存在对应的命令行工具,就应优先选择 CLI。Claude Code 能够自主搜索安装命令、处理凭据配置并一步步引导用户完成复杂的服务器设置流程。

进阶技巧:少样本提示与对抗式审查

  • 通过上传参考网站的截图和 HTML 代码实施少样本提示,能更精准地控制视觉输出。
  • 对抗式代码审查通过让模型扮演批评者角色,来发现隐藏的代码缺陷。
  • Codex 插件为 Claude Code 引入了 OpenAI 模型,作为第二双眼睛进行独立审查。

少样本提示减少了生成结果的随机性,让用户通过具体示例引导模型。由于模型对自己生成的代码通常过度宽容,因此需要开启第二个终端进行对抗性提问,或者引入不同厂商的模型(如通过 Codex 插件)进行交叉验证。这对于没有技术背景、无法自行评估代码质量的用户尤为重要。

高级自动化:钩子、子代理与代理团队

  • 自定义钩子(Hooks)可在任务完成时自动触发声音提示或邮件通知。
  • 子代理模式下,主实例可生成多个独立实例并行处理搜索或开发任务。
  • 代理团队(Agent Teams)允许不同任务的子代理相互通信以协同解决复杂冲突。

高级用户可以利用钩子来应对长时间运行的任务,通过声音反馈避免注意力分散。子代理虽然能并行工作,但由于彼此处于信息孤岛,可能产生代码冲突。代理团队则是实验性功能,它模拟了人类团队的中层管理机制,让负责前端、身份验证和支付的代理能够同步进度,尽管这会消耗更多的 Token 预算。

专业流:Git 工作树与计划任务

  • Git 工作树为每个终端分配独立的文件副本,防止多个会话互相覆盖工作。
  • Loop 命令支持在 7 天内以固定间隔重复执行特定任务,但需保持终端开启。
  • 桌面应用中的 Scheduled 功能支持运行不依赖于当前终端会话的远程或本地任务。

同时开启多个终端进行开发可能只是生产力表演,真正的多任务并行需要 Git 工作树来管理文件冲突。对于需要长期运行的任务,如每日监测 GitHub 趋势,用户可以在 Windows 系统中创建计划任务,或利用桌面应用的 Scheduled 功能。这使得 Claude Code 能够脱离实时监控,成为一个自动化的后台处理引擎。

Ultra Plan 与前沿工具发现

  • Ultra Plan 采用更强大的云端代理架构,并支持对计划细节进行交互式标注。
  • 远程控制功能支持通过移动端 App 同步观察并操作正在运行的终端会话。
  • 利用 Claude Code 监控 GitHub Trending 页面是获取前沿 AI 仓库的最快路径。

Ultra Plan 为复杂项目提供了更好的协作界面,允许用户像在文档中评论一样修改 AI 计划。由于 AI 领域节奏极快,直接让 Claude Code 每日汇总热门项目可以避免信息滞后。通过克隆新仓库并让模型解释其原理,用户可以在没有传统技术背景的情况下,始终保持在技术发展的最前沿。

Community Posts

View all posts