你的 Claude Code 代理操作系统弱爆了

CChase AI
Computing/SoftwareAdvertising/MarketingSmall Business/StartupsInternet Technology

Transcript

00:00:00你的 Cloud Code 智能代理操作系统很糟糕,这是因为你关注了错误的
00:00:05事物。
00:00:05你把所有时间都花在了华丽的仪表板和类似这样的指挥中心上
00:00:09还有这一个,而不是专注于在 Cloud Code 智能代理操作系统中
00:00:14真正驱动价值的东西。
00:00:15那就是这个:一个真正驱动一切的技能与自动化骨架。
00:00:20问题是,要高水平地打造这样的东西需要时间,
00:00:25既不显眼,甚至可能有点无聊,
00:00:28尤其是当你把它们与这些能带来海量流量的酷炫指挥中心相比时。
00:00:33但事实是,要从 Cloud Code 智能代理操作系统中获得任何价值,
00:00:37特别是当我们谈论可观测性部分、
00:00:40仪表板部分、指挥中心这类东西时。
00:00:42只有在这一步到位后,一切才会发生。因为一个强大的
00:00:48智能代理操作系统包含三个部分。第一部分就是你在这里看到的。
00:00:52它是技能与自动化骨架。
00:00:54其核心思想是将 Cloud Code 转化为一个
00:00:58能为我们提供可靠输出的系统。
00:00:59我们将把你、你的团队或你客户的日常工作流和任务
00:01:05转化为技能,并在合适的地方将这些技能转化为自动化。
00:01:09在这个过程中,构建出像你在这里看到的这种凝聚性系统。
00:01:14这样我们就能高水平地重复同样的操作,并获得
00:01:19一致的输出。智能代理操作系统的第二部分是记忆层。
00:01:23我们该如何处理上下文工程(Context Engineering)的构想?嗯,
00:01:27有很多种方法可以实现。
00:01:28我们可以用成熟的知识图谱做一些非常花哨的东西,比如 LightRAG;
00:01:32或者我们可以保持简单,直接使用 Obsidian 这样的工具,
00:01:36这对绝大多数人来说已经足够提供 80% 的解决方案了。
00:01:40只有当我们锁定了所有这些内容,任何形式的仪表板或操作系统的指挥中心才有意义,
00:01:45因为仪表板的价值实际上体现在两个方面。首先是可观测性。
00:01:51其核心在于我可以弥补一些在终端(Terminal)操作的弱点。
00:01:53即能够弥补在终端操作时的一些不足。
00:01:57比如查看我社交媒体频道的各项指标,
00:02:00并让所有的研究成果都在一个标签页中向我展示。
00:02:03另一半价值来自这里,也就是所有这些按钮。
00:02:06其核心想法是,如果我想把 Cloud Code 的力量带给一个
00:02:10从不使用终端的团队成员或客户,
00:02:14我可以为他们构建出那套技能架构,并将其分配给这些按钮,
00:02:17这样他们基本上只需点击一下,就能按需执行这些任务。
00:02:22所以今天我将向你们展示如何正确设置这套技能骨架。
00:02:26然后我们将讨论仪表板的一面,因为在这种场景下,
00:02:30实际上有很多你可以做的事情。通常有两条路径。
00:02:35你可以像刚才看到的那样,我一直在向你展示两个版本。
00:02:37一种就是你在这里看到的,它实际上是 Obsidian 本身的一部分,
00:02:40这非常酷,因为我们还获得了一个集成终端;
00:02:44另一种是 Web 应用版本,它是专门为分发而设计的。
00:02:47如果你想引入其他团队成员或为客户打包功能。
00:02:50但在我们深入探讨具体的操作细节之前,
00:02:53先听听今天赞助商——我本人的简短介绍。如你所知,在 Chase AI
00:02:56Plus 内部,我刚刚发布了 Claude Code 大师课,
00:03:01这是从零基础变身 AI 开发者的首选途径。
00:03:03而且我还刚在里面增加了智能代理操作系统大师课。
00:03:06所以你在今天视频中看到的提示词、仪表板、设置,
00:03:11所有这些都可以在 Chase AI 内部找到更深层次的内容。
00:03:15置顶评论中有相关链接。此外,就在今天,
00:03:19我猜当这个视频发布时,
00:03:23我将举办一场关于如何为自己设置
00:03:24贯穿全部三层架构的智能代理操作系统的免费网络研讨会。
00:03:28所以如果你想加入,请务必查看置顶评论。
00:03:32我会在那里放上这两个链接。既然核心价值都在这里,那我们该如何设置?
00:03:35为什么要这样设置?为什么它看起来像一张组织结构图?
00:03:38这种像你在这里看到的组织结构图布局,我们将内容
00:03:42拆分成不同的部分,如生产力、研究和内容。
00:03:46这只是为了帮你可视化一些原本无形的东西。
00:03:49这仅仅是为了建立你的心理模型。
00:03:53其核心思想是,你在日常的工作流程中,
00:03:54无论是在业务上还是个人生活中,都会跨越许多不同的领域。
00:03:58对我来说,这被划分为诸如生产力之类的事情。
00:04:01比如谷歌、研究、内容、我的社区、代理机构、销售等等。
00:04:04对我而言,这被划分为诸如生产力之类的事项。例如 Google、
00:04:09研究、内容、我的社区、我的代理机构、销售等等。
00:04:13把所有这些不同的任务拆分出来,并将它们转化为技能。
00:04:18为什么要转化为技能?嗯,
00:04:21很可能你现在使用 Cloud Code 的方式是,当你需要它做某事时,
00:04:26你只需在终端启动 Cloud Code,然后告诉它要做什么。
00:04:30你基本上只是把它当成一个稍微好用一点的 ChatGPT。
00:04:32如果你一直这样做,
00:04:34为什么不把这些操作编入技能中呢?
00:04:37因为当我们将其编入技能时,会带来几点好处。第一,
00:04:41它非常方便。我接手了整个任务,
00:04:44而不再需要用一整段话来描述,
00:04:47我只需输入技能名称,哪怕只是一个单词,它就能完成。这非常方便。
00:04:51第二点是,既然我们已经将其编入代码,
00:04:54我们还可以使用“技能创建技能”之类的工具对其进行测试。
00:04:56我们能够真正地为我们创建的技能设定基准。
00:05:00这样我们可以看到,首先,
00:05:05这个技能是否有意义,因为它会进行 A/B 测试:使用技能 vs 不使用技能。
00:05:09随着时间的推移,如果技能足够好,我们就能在这个本质上是
00:05:14非确定性的系统中,开始获得更多确定性的输出。
00:05:16当我们谈论 LLM(大语言模型)时,它存在一定的随机性,
00:05:20这是由其工作原理决定的。任何时候只要能减少随机性,
00:05:25就是进步。通过将你日常所做的事情编入代码并转化为技能,
00:05:30我们就朝着这个目标迈出了一大步。
00:05:33虽然这对很多人来说很有道理,但如果你问他们
00:05:38是否真的曾坐在终端前,打开麦克风,
00:05:42打开 Claude 并说:“嘿,这是我的日常计划,这是我平时做的,
00:05:45你能从中提取一些技能,并使用技能创建技能将它们转化出来吗?”
00:05:47真正这样做的人数比例恐怕屈指可数,
00:05:50这太疯狂了,因为这是升级你使用 Cloud Code 方式的
00:05:54打开 Claude 并说:“嘿,这是我的每日计划。这是我做的事情。”
00:05:59“你能从中提取出一些技能,然后利用‘技能创建器’技能”
00:06:04在很多不同的领域做了很多不同的事情。
00:06:05通常情况下,我们甚至可以将许多任务组合成
00:06:09所谓的“工作流技能”或高级技能,让它一次完成多项任务。
00:06:14例如,我有一个名为“内容瀑布”(Content Cascade)的技能。
00:06:15这个技能本质上是一个内容二次开发者。当我制作完一段
00:06:19YouTube 视频并调用内容瀑布技能时,它会为我做很多事。
00:06:22它会下载字幕,生成博客文章,
00:06:28创建 LinkedIn 动态,编写 Twitter 帖子。它会启动 Playwright,
00:06:32然后帮我把这些内容发布出去。
00:06:33这是一堆相互独立的任务,但现在不需要拆分成九个不同的技能,
00:06:37这个技能本质上是一个内容重分发器,当我制作好
00:06:42YouTube 视频并调用“内容级联”技能时,它会为我执行多项操作。
00:06:46它会自动下载转录文本,生成博客文章,
00:06:50创作 LinkedIn 动态和 Twitter 帖子,甚至启动 Playwright。
00:06:54正是这种逐步梳理并将其代码化的过程,构成了
00:06:57智能代理操作系统的力量。除此之外的其他东西,
00:07:00无论是记忆层还是仪表板,都只是点缀其上的装饰。
00:07:03如果你并不打算与团队成员协作,
00:07:04也不打算将这些东西打包出售,
00:07:09你大可以在这里止步,因为这个 80% 的解决方案
00:07:12已经让你遥遥领先了。
00:07:13执行这个过程的核心其实非常简单。
00:07:18就像我说的:打开终端,启动一个新会话,然后开始倾诉。
00:07:21最后说:“嘿,我们能把这些转化成技能吗?”
00:07:24我有一整套提示词,详细分解了如何进行技能分类筛查,
00:07:27但其核心就是这些:这是我做的事,把它转成技能。太棒了。好,来测试一下。
00:07:30接着转向我业务或团队中的下一个领域。问题在于,
00:07:32这将是非常定制化且完全针对你个人的。
00:07:35我觉得我们有时会迷失在市面上流传的那成千上万个技能中。
00:07:38我们去逛那些大型仓库,比如“Awesome Claude Skills”,
00:07:43看着数以千万计的技能,心想这些东西会改变
00:07:47我使用 Claude Code 的日常产出。
00:07:51这就好比在大海捞针,而忽略了
00:07:54Claude Code 最强大的地方之一,就是为个人进行定制是多么容易。
00:07:58我们为什么不更系统地利用这一点呢?
00:08:01但在这些定制内容之外,我认为有几样东西是几乎所有人都能受益的。
00:08:06在生产力方面,如果你处于谷歌生态系统中,
00:08:10我之前提到过,使用 GWS CLI 工具
00:08:15基本上可以让你在谷歌生态系统内执行任何操作,并将它们转化为技能,
00:08:19无论是邮件分类、谷歌云端硬盘操作,还是日历管理。
00:08:21但事实上,你也可以直接使用 Claude Code 自带的标准 MCP 连接器。
00:08:25我指的就是基础的 Claude.ai Gmail、谷歌日历和云端硬盘连接器。
00:08:27你唯一的损失是无法直接发送邮件,
00:08:31但你仍然可以创建草稿,这对很多人来说已经足够了,
00:08:34因为他们并不想让 AI 直接把邮件发出去。
00:08:38设置这些只需 30 秒,而它带来的生产力提升,
00:08:39再次强调,真的很少有人去实际操作。现在,
00:08:43在你完成了这个技能创建过程之后,
00:08:44接下来的关键是决策树。对于每一个技能的自动化,
00:08:48它是需要按需执行,还是可以转化为 Claude Code 内部的例行任务?
00:08:53当我们谈论 Cloud Code 的例行任务和自动化时,它被分为两个部分。
00:08:58即本地自动化(Local)与云端自动化(Cloud)。
00:09:01如果你不确定该选哪个,就选本地。这意味着只要你的电脑开着,
00:09:05它就会在某种形式的云端接入下运行。
00:09:06而云端自动化意味着它将在 Anthropic 的服务器上运行,
00:09:11你会受到执行次数的限制,因为成本是由他们承担的。
00:09:15而且如果是在云端运行,
00:09:17它是无法访问你真实的电脑的。它不在你的机器上跑,
00:09:20也就无法访问你的命令行界面、技能或文件。
00:09:24所以大多数情况下,如果有疑问,选本地自动化准没错。
00:09:27这就是构建 Claude Code 智能代理操作系统骨架的过程。
00:09:30我一直在提 Claude Code,但事实是 Claude Code 只是引擎。
00:09:33我们稍后会更详细地讨论这一点。你完全可以把它换成 Codex,
00:09:36或者任何其他工具。我们要构建的是它的底盘,
00:09:39引擎是可以随时更换的。
00:09:43所以这里所说的一切也同样适用于像 Codex 这样的工具。
00:09:47在深入探讨指挥中心和可观测性仪表板之前,
00:09:49我们先简单聊聊 Obsidian 和记忆层,
00:09:55因为我觉得很多人对于 Obsidian 到底能带来什么以及它的意义感到困惑。
00:09:59记住,Obsidian 的作用仅仅是一个组织层。
00:10:02Obsidian 并没有对这些 Markdown 文件做任何特殊处理。
00:10:04它只是给了身为人类的我们一个方式,去理清文件里
00:10:07到底发生了什么,并提供了一种简单的连接方式。
00:10:10它本质上并没有改变记忆机制。这不是 RAG(检索增强生成)。
00:10:11它没有嵌入任何东西,也没有所谓的向量数据库,
00:10:15尽管你可能会看到那些酷炫的图形展示,
00:10:17但从技术层面来说,它并不是真正的知识图谱。话虽如此,
00:10:22保持组织性是非常重要的,特别是当文件规模达到成千上万份时。
00:10:26这种重要性不仅体现在方便你找东西,
00:10:30在一定的规模下,对于 Claude Code 在 Token 效率和内容精炼方面也变得至关重要。
00:10:32这就是为什么大家都会提到 Karpathy 的 RAG 命名法,我们快速过一下。
00:10:36其核心思想是,我们有一个“库”(Vault),也就是 Obsidian 的所在地,
00:10:39以及一系列子文件夹。Karpathy 认为:
00:10:42我们需要一个 raw 文件夹来存放非结构化数据;需要 wikis,
00:10:44用来将这些原始数据转化为报告、文章等信息;
00:10:48最后是 outputs 文件夹来存放最终交付成果。举个例子:
00:10:50我做了一些关于 AI 智能代理的研究,这些原始资料进入了 raw。
00:10:54随后这些研究被整理成了一篇关于 AI 智能代理的文章,
00:10:55存放在我的 AI 智能代理 wiki 文件夹中。
00:10:59(此处原文无第 189 段翻译,按要求补齐)
00:11:04(此处原文无第 190 段翻译,按要求补齐)
00:11:09(此处原文无第 191 段翻译,按要求补齐)
00:11:13(此处原文无第 192 段翻译,按要求补齐)
00:11:17(此处原文无第 193 段翻译,按要求补齐)
00:11:21(此处原文无第 194 段翻译,按要求补齐)
00:11:24(此处原文无第 195 段翻译,按要求补齐)
00:11:28(此处原文无第 196 段翻译,按要求补齐)
00:11:29(此处原文无第 197 段翻译,按要求补齐)
00:11:32(此处原文无第 198 段翻译,按要求补齐)
00:11:36(此处原文无第 199 段翻译,按要求补齐)
00:11:37当达到一定规模时,这对 Claude code 来说也很重要,
00:11:40关乎 Token 效率和精简。这就是大家提到这个的原因,对吧?
00:11:45Karpathy 的 RAG 命名,我们快速过一下。
00:11:47其核心思想是,我们有一个库(Vault),
00:11:49即 Obsidian 的存放处,以及一系列子文件夹。Karpathy 说,
00:11:53我们有用于存放非结构化数据的 raw 文件夹。我们有 wiki 文件夹,
00:11:58将这些非结构化数据转化为报告或文章。
00:12:02最后我们有用于存放交付成果的 outputs。所以,
00:12:05我做了一些关于 AI 智能体的研究,存入 raw。
00:12:09这些研究在我的 AI 智能体 wiki 中转化成了一篇文章。
00:12:13嘿,我把它变成了一组幻灯片。大概就是这样。
00:12:16事实是,你完全不需要非得这样做。
00:12:19你只需要找到一种对自己有意义的方式即可。
00:12:24而且这种方式能让你和 Claude code 轻松穿梭于文件夹系统。
00:12:29即使里面有十万个文件,
00:12:33这样的基准也是一个好的开始,特别是因为存在所谓的
00:12:37主索引文件和散布各处的索引文件。
00:12:40这些索引文件基本上存在于 Obsidian 的每一层级。
00:12:45记住,Obsidian 只是一个文件夹。
00:12:47所以我们讨论的是向下延伸的每一个子文件夹。
00:12:49总有某个文件夹充当着目录的角色。
00:12:52如果我在库中点击里面的 wiki 文件夹,
00:12:57wiki 文件夹里有一个名为索引文件的目录,它告诉我:
00:13:02“这里面有智能体、RAG 系统和内容创作 wiki。”
00:13:06太好了,我知道去哪了。我进入 AI 智能体文件夹。里面有什么?
00:13:11还有另一个索引。又一个目录在说:“嘿,”
00:13:16“在 AI 智能体文件夹里,”
00:13:18“有这份文档和那份文档。”这是我从 Karpathy 那里学到的核心观点,
00:13:23即索引的概念,以及在 Obsidian 和文件结构的每一层中,
00:13:27都有一个主文档引导我找到正确的方向。
00:13:30如果你一开始没有建立这个机制,
00:13:33等到有 5000 份文档时,你就慢慢找吧。
00:13:34就我而言,我有几个文件夹。我有归档、内容、笔记、
00:13:38仪表盘、收件箱、运营、项目系统、Wiki,这对我来说很清楚。
00:13:42我有一个索引。我明白是怎么回事。
00:13:47你需要定制这些东西,让它对你有意义。
00:13:49你需要根据自己的需求进行定制,这样它对你才有意义。
00:13:53说到定制化,现在让我们进入仪表板的部分。
00:13:57我们之前已经稍微谈过其中的价值了,对吧?
00:14:01关于这一点的价值所在,我们之前已经稍微讨论过了,对吧?
00:14:03它的核心理念在于可视化,让我能直观地看到那些
00:14:07而且我们有这些任何人都可以使用的技能面板。
00:14:08接下来的问题是,为什么会有两个?
00:14:11为什么要在 Obsidian 内部放一个?
00:14:14因为我现在就在 Obsidian 里面。
00:14:17为什么还要在本地主机上搞一个 Streamlit 应用?
00:14:19那本质上是一个 Web 应用。这两者有什么区别,
00:14:22分别适用于什么场景?我认为 Streamlit 应用,
00:14:25或者说任何 Web 应用的价值,
00:14:28在于它是你智能体操作系统的仪表盘层,是为了分发。
00:14:31如果我想把这个带给团队,或者想把它打包给客户,
00:14:35采用这种配置会非常简单。
00:14:38我可以把模板放在 GitHub 上,然后非常迅速地
00:14:41分发给任何地方的任何人。
00:14:46搭建过程真的只需要几秒钟。
00:14:48如果这是给非技术团队成员或非技术客户用的,
00:14:50尽量保持简单,只需要清晰的按钮
00:14:54映射到各项技能并执行。这太棒了,正是他们想要的。
00:14:57Obsidian 仪表盘则有点不同。
00:15:01你是在牺牲分发性来换取人体工程学(操作便利性)。
00:15:04而且我认为它更强大,因为操作非常简单。
00:15:08正如你在这里看到的,你也可以在 Obsidian 指挥中心里
00:15:11集成一个终端,
00:15:16这意味着我现在拥有了两全其美的方案,
00:15:19更不用说因为它在 Obsidian 内部,我的所有资料都在手边
00:15:22供我随时取用。而且 Obsidian 拥有无限的定制空间,比如这里,对吧?
00:15:26我有完整的日历,但这不是那种日历插件。
00:15:30这实际上只是我把 Google 日历网页
00:15:34打开并放在右边,这样就能非常清晰地了解
00:15:38当天的安排、任务,以及
00:15:43动态流里的内容,还有我在不同社区的状态。
00:15:45以及动态消息的进展,还有我在不同
00:15:48社群中的处境。我想深入探讨受众相关的内容。
00:15:51也有专门的标签页显示热门 GitHub 仓库、
00:15:54Hacker News,以及我的一些简报,这些也与技能挂钩,
00:15:58比如头条新闻、X 和 YouTube 上的动向以及内容机会。
00:16:02再说一次,如果处于纯终端环境,
00:16:06处理这些会有点笨重。
00:16:08也会更加困难。但是,
00:16:12正如我提到过的,Obsidian 方案的问题在于分发。
00:16:14我该如何把这样的东西分发给团队或客户?
00:16:18其实也可以做到,因为这整个仪表盘指挥中心本质上
00:16:23只是 Claude code 创建的一个自定义插件,但还是那句话,
00:16:28帮别人搭建会很笨拙且尴尬。不是简单的“克隆即用”,
00:16:32而是“先克隆,再进 Obsidian,”
00:16:37“启用这些插件,把这个移到这,那个移到那,”
00:16:41“做完所有这些步骤。”所以存在一定的尴尬感。
00:16:44所以,如果你是单兵作战,并且想:
00:16:48“我想要一个带 Claude code 的智能体操作系统,”
00:16:52“想要所有这些酷炫的自定义按钮,”
00:16:54“还想让终端在同一个面板上清晰可用。”
00:16:58那么 Obsidian 路线是完美的。另一方面,如果你想:
00:17:02“我打算把这打包给团队和客户,并将其产品化。”
00:17:07那么 Web 应用才是王道。
00:17:10但请记住,这些系统的强大程度仅取决于其下的技能架构。
00:17:12它只是 Claude code 之上的一层漂亮外壳,
00:17:16如果没有底层架构,
00:17:19这只是些花哨的废话,仅此而已,对吧?
00:17:21你需要一些实实在在的内容。所以不要忘记你的核心价值所在。
00:17:26那么我就讲到这里。
00:17:30希望我已经讲清楚了这些智能体操作系统的价值所在。
00:17:31我看到有一部分人对此大加抨击,说它们毫无价值。
00:17:36我觉得这种评价非常不公平。
00:17:37当他们抨击时,通常针对的是仪表盘那一面,
00:17:41如果你脱离背景去争论仪表盘或指挥中心,那确实有道理,
00:17:45但这并不符合现实。真正的力量在于,
00:17:48仪表盘和所有这些只是某种表象,
00:17:52真正起作用的是背后的东西。那才是重心所在。
00:17:56我认为我们应该关注那里。如果我们关注技能系统,
00:17:59那么,
00:18:02难道我们会认为不该拥有一套基于日常生活、成体系的技能吗?
00:18:06我觉得很难反驳这一点。哦,最后一件事,
00:18:07其他人也提到了成本问题,这很重要,
00:18:11尤其是如果你最近有关注相关动态。
00:18:13使用 dash P 命令进行无头模式的
00:18:17Claude code 运行,似乎是 Anthropic 现在不喜欢的做法。
00:18:20所谓的“不喜欢”,是指
00:18:22他们虽然专门给了 200 美元用于此,但计入的是 API 成本。
00:18:26在这一整套设置中会有问题吗?因为你可以想象,
00:18:31这一切在底层都是无头运行 Claude code。既有问题也没有问题。
00:18:31要用完每月 200 美元,你得疯狂刷这些指令才行。
00:18:35所以我认为在现实中,
00:18:40这可能不会成为问题。如果真的成了问题,
00:18:45或者你觉得遇到了用量瓶颈,或是客户遇到了用量问题。
00:18:49简单的解决方案是,把这一切迁移到像
00:18:55Codex CLI 之类的工具上,因为 Codex 也很棒,而且没有这些问题。
00:18:59而且你能获得更高的性价比。
00:19:01在这里切换底层为 Codex 也非常简单。
00:19:04我是说,你可以用 Claude code 来做这件事。
00:19:09你只需要让它指向代码,然后说:“好,”
00:19:12“我们改一下,现在改用 Codex CLI 替代 Claude。”
00:19:16所以这基本上是几分钟内就能完成的重构。
00:19:18你甚至可以在仪表盘上放个按钮,我以后可能会加。
00:19:21比如:“好,切换到 Codex 版本。”
00:19:26总之,这是需要注意的一点。实际上,对于 99.99% 的人来说,
00:19:30它没有影响。这就是我要讲的内容,再次强调,
00:19:33你在这里看到的每一项,
00:19:35如果你想要我这套 Obsidian 指挥中心
00:19:40以及其他所有的配置,都可以在 Chase AI Plus 里找到。
00:19:43另外,记得查看正在举行的网络研讨会,
00:19:45如果你想要我那个 Obsidian 指挥中心
00:19:50以及其他所有内容的具体设置,你可以在 Chase AI Plus 中找到
00:19:53另外一定要关注正在进行的网络研讨会,就在,你知道的,
00:19:57大概在这段视频发布后的 20 小时左右。
00:20:01除此之外,我们回头见。

Key Takeaway

构建 Claude Code 操作系统的成功关键在于通过“技能创建器”将个性化工作流代码化,并结合 Obsidian 的多层索引结构实现高 Token 效率的自动化生产。

Highlights

  • Claude Code 智能代理操作系统的核心价值在于“技能与自动化骨架”,而非视觉上的仪表板或指挥中心。

  • 通过将日常工作流编入代码,可以利用 A/B 测试对技能进行基准测试,减少大语言模型的非确定性随机输出。

  • “内容瀑布”(Content Cascade)技能可一次性完成下载转录文本、生成博客文章、创作社交媒体动态及自动发布等多项任务。

  • Obsidian 作为记忆层并不改变底层的 RAG 机制或向量数据库,其核心作用是为人类提供万级文件规模下的组织逻辑。

  • 采用 Karpathy 的 RAG 命名法,将 Vault 划分为 raw(原始数据)、wikis(结构化报告)和 outputs(交付成果)三层结构以提升 Token 效率。

  • 在 Obsidian 中集成终端并配合索引文件(Index files),可实现比纯终端环境更高的人体工程学操作效率。

  • Claude Code 在无头模式(-p 命令)下运行会消耗 API 额度,若达到用量瓶颈可无缝重构为 Codex CLI 以降低成本。

Timeline

智能代理操作系统的三层架构

  • 核心价值由底层技能架构驱动,而非表面的仪表板或可视化中心。
  • 三层架构由技能与自动化骨架、记忆层以及仪表板层共同组成。
  • 仪表板的主要功能是提供可观测性并为非技术团队成员提供一键式技能触发按钮。

多数用户将精力浪费在复杂的指挥中心界面上,忽视了真正驱动价值的自动化骨架。技能架构负责将重复的任务转化为可靠的系统输出,而记忆层则解决上下文工程的问题。只有在底层架构稳固后,仪表板才能通过弥补终端操作的不足来发挥可观测性的作用。

将工作流转化为代码化技能

  • 将日常对话式指令转化为固定技能可大幅提升操作便捷性并减少随机性。
  • “内容瀑布”等高级工作流技能可以串联下载、写作、社交媒体适配和 Playwright 自动发布流程。
  • 通过 A/B 测试对比使用技能前后的效果,可以为非确定性的 LLM 系统建立可靠的输出基准。

将 Claude Code 仅视为聊天机器人会限制其潜力。通过在终端中描述日常任务并使用“技能创建器”提取逻辑,可以将冗长的提示词缩减为一个单词的命令。这种代码化过程不仅提高了效率,还允许系统在多个领域进行定制,例如将 YouTube 视频内容快速重分发到 LinkedIn 和 Twitter。

利用 GWS CLI 和标准连接器提升生产力

  • GWS CLI 工具允许在谷歌生态系统内执行邮件分类、云端硬盘管理和日历操作。
  • 本地自动化比云端自动化更灵活,因为它能直接访问用户的命令行界面、本地文件和自定义技能。
  • Claude Code 的标准连接器虽然无法直接发送邮件,但可以快速生成草稿以供审核。

对于使用谷歌办公套件的用户,只需 30 秒即可配置好基础连接器。在选择自动化路径时,本地运行(Local)通常是首选,因为云端运行受限于 Anthropic 的服务器环境,无法调用用户的本地工具链。这种设置确保了 AI 代理能够在保护隐私的同时深度集成到现有工作流中。

Obsidian 记忆层与 Karpathy 组织法

  • Obsidian 的作用是作为文件组织层,而非技术意义上的向量数据库或知识图谱。
  • 多层文件夹系统中的索引文件是引导 Claude Code 快速定位信息的关键导航点。
  • Karpathy 的 RAG 命名法通过 raw、wikis 和 outputs 文件夹实现从原始数据到最终成品的闭环。

随着 Markdown 文件数量增加到数千份,缺乏组织的存储会导致 Token 浪费和检索失败。Karpathy 的组织策略强调了结构化转换的重要性:原始研究存入 raw 文件夹,随后提炼为 wiki 报告,最后生成交付件。在每个层级建立主索引文件,可以让 AI 在处理十万级文件规模时依然保持极高的定位精度。

Web 应用与 Obsidian 仪表板的差异化分发

  • Streamlit 等 Web 应用适合作为标准化的产品交付给非技术客户或团队。
  • Obsidian 内部仪表板提供更高的人体工程学体验,可集成实时终端和 Google 日历网页。
  • Obsidian 方案由于涉及插件配置和布局调整,其分发便利性弱于基于 GitHub 的 Web 应用。

选择哪种仪表板取决于使用场景。单兵作战时,Obsidian 的集成终端和资料随手可得的特性更具优势。若需将系统产品化或分发给客户,则应选择 Web 应用路径。无论外壳如何变化,底层的 Claude Code 始终是驱动引擎,而仪表板只是为了可视化展示 GitHub 热榜、社交媒体趋势等原本在终端中难以观察的信息。

成本优化与底层引擎重构

  • Claude Code 的无头运行会计入 API 成本,但在大多数实际场景中难以触及 200 美元的限制瓶颈。
  • 若遇到 API 额度限制,可将底层引擎从 Claude Code 切换为性价比更高的 Codex CLI。
  • 底盘架构与引擎分离的设计使得系统重构仅需几分钟即可完成。

针对社区对 API 成本的担忧,可以通过将 Claude Code 指向代码并下达重构指令,将其替换为 Codex 等其他工具。由于智能代理操作系统是基于底层的技能骨架构建的,引擎的更换并不会破坏上层的业务逻辑。对于 99.99% 的用户而言,当前的 API 配额已足够支撑日常的高频自动化操作。

Community Posts

View all posts