5月推荐:十大热门开源 Claude 代码工具

CChase AI
컴퓨터/소프트웨어창업/스타트업구직/면접AI/미래기술

Transcript

00:00:00GitHub 上每天都会出现数百个新的开源 AI 项目,
00:00:04但真正值得你花时间的却寥寥无几。
00:00:08但今天我要重点介绍 10 个项目,几乎今天我们要涵盖的每一个工具
00:00:12都是在过去一个月内才刚刚推出的。
00:00:15所以,除非你像我一样痴迷于这些东西,
00:00:18否则我保证你至少会接触到几个新工具。
00:00:22列表中的第一个工具是我的最爱,因为它是我目前字面意义上
00:00:25每天都在使用的工具。那就是 Caveman Skill。
00:00:28这个库在发布后的第一个月内就获得了超过 50,000 颗星。
00:00:32它的核心理念是,这只是一个可以在 Claude Code 或
00:00:36Codex 内部使用的技能,让我们的智能体像原始人一样说话,也就是说它不会
00:00:41那么啰嗦。
00:00:43这里有一些例子,你可以看到正常的 Claude Code 回复,
00:00:46它总是滔滔不绝。但如果我使用 Caveman,
00:00:50它就会直接切入正题。
00:00:51这个库采用了“能用几个字说明白,何必多费唇舌”的想法,并将它
00:00:56代码化了。而且,
00:00:57Caveman 的酷炫之处在于它是有等级的。
00:01:00比如我们不需要完全变成尼安德特人。我们可以用“轻量原始人”模式,
00:01:03这也是我常用的。我们也可以选择“完全”或“极致”模式。不过,
00:01:07我得说这个库在宣传它能节省多少
00:01:11Token 时有点过于兴奋了。它会说,嘿,
00:01:13我们节省了大约 75% 的输出 Token。
00:01:15要理解 Caveman 的工作原理只是改变了
00:01:20你看到的词数。它并没有改变它的思考方式。
00:01:22它也没有改变它摄入的内容量。所以总的来说,
00:01:26如果我们综合来看,在 Token 节省方面,
00:01:30你大约能看到 5% 左右的缩减。我针对这个做过一个完整的视频,
00:01:32我会把链接放在上面。如果你想深入了解的话。不过,
00:01:35我认为 Caveman 的秘诀在于,
00:01:37而且我觉得他们有点忽略了重点,那就是如果强迫大语言模型
00:01:41给出更简洁的回复,它们实际上可能会表现得更好。
00:01:45这源于 2026 年 3 月的一篇论文。题目叫《简洁约束:
00:01:49逆转语言模型的性能层级》。
00:01:52基本上,它的核心观点是,当我们拥有强大的模型并
00:01:57强迫它们保持简洁时,
00:01:58它们更有可能给出正确的答案,因为它们基本上不会
00:02:01因为废话太多而把自己绕进错误的答案里。
00:02:04这确实是一个非常有趣的研究。
00:02:06我强烈建议你看一看。
00:02:07所以把这些结合在一起:我们既能节省 Token,又
00:02:11有可能获得实际的质量提升。
00:02:13这东西有什么理由不爱呢?而且它只是一个简单的技能安装。
00:02:17安装非常简单。你可以直接在库里运行这里的命令,
00:02:20或者直接复制库的 URL,放入 Claude Code 中并说:嘿,
00:02:24让我们开始运行 Caveman。如果你想用“轻量原始人”,
00:02:26就说 Caveman light。如果你想用“极致”,就选 ultra,
00:02:30执行起来非常容易。
00:02:31我一直是这些轻量级工具的忠实粉丝,它们能在边际上带来胜利
00:02:34而没有真正的副作用。所以即使你不看别的,
00:02:38也要看看 Caveman。但在我们继续看第二个工具之前,
00:02:41先听听大家最喜欢的赞助商——也就是我,简单说几句。
00:02:44我最近推出了我的 Claude Code 大师课,这是从零基础
00:02:48成长为 AI 开发者的一号途径,
00:02:50特别是如果你没有技术背景的话。
00:02:53我每周都会更新,我们非常专注于现实生活中的用例,并
00:02:58在 Claude Code 的基础上构建诸如完整的智能体操作系统
00:03:03之类的东西。所以如果你对这方面感兴趣,
00:03:06你可以在 Chase AI 中找到它。
00:03:08另外,置顶评论里有链接。现在,
00:03:10二号工具是关于内存和知识图谱的。那就是 Graphify。
00:03:15Graphify 的功能是读取我们的文件来构建知识图谱。
00:03:19因为我们现在给了 Claude Code 一个清晰的结构来理解我们正在处理的内容,
00:03:23所以,
00:03:24我们能够在执行任务的同时,使每次查询使用的 Token 大大减少。
00:03:28他们称,与阅读原始文件相比,
00:03:33每次查询的 Token 减少了 71.5 倍。现在,当我们谈论知识图谱和内存时,
00:03:36我们中的很多人首先会想到像 Obsidian 这样的工具,但 Obsidian
00:03:40虽然理论上确实给了我们一个知识图谱,
00:03:43也就是我们现在看到的这个,但它并不是真正意义上的
00:03:46知识图谱,不像 Graph RAG 系统,比如 LightRAG 或 RAG,
00:03:50Graphify 的一切都比 Obsidian 更接近那种真正的 RAG 结构,
00:03:55记住,Obsidian 归根结底只是一个让我们能够
00:03:59处理 Markdown 文件的漂亮界面,而且仅限于 Markdown 文件。
00:04:03Graphify 则是多模态的。
00:04:06它指的多模态并不是说它会摄入纯视频,
00:04:09像谷歌的 Embedding 2 那样,
00:04:12但它能够查看 PDF、截图、图表等内容,
00:04:16并且它能够处理视频,然后使用 Whisper 提取它需要的内容。
00:04:20此外,Graphify 不使用嵌入 (Embedding)。
00:04:23所以当我们讨论像 Obsidian 这种工具
00:04:26和像 LightRAG 这种真正的 RAG 系统之间的光谱时,
00:04:29我会说 Graphify 处于中间位置。
00:04:31而且它是我们基本上可以叠加在 Obsidian 之上的东西。
00:04:34所以如果你是一个热爱 Obsidian 的人,
00:04:36希望在底层内存和文件处理方面获得更多动力,
00:04:40但又不想迈向那种带有嵌入等功能的真正的
00:04:44RAG 系统。那么,
00:04:47Graphify 可能非常适合你,请务必关注对这个特定主题的
00:04:52深入探讨,或者关注未来几天可能发布的视频。
00:04:57现在,三号工具是你可能以前没听过的。
00:05:00它是 Claude Video,上周刚刚发布。目前有 400 颗星。
00:05:03它的作用是赋予 Claude 观看视频的能力。
00:05:07我这么说是什么意思?因为我们知道 Sonnet 和 Opus 无法摄入视频。
00:05:12嗯,这个工具采用了一个非常聪明的办法。一旦给定一个视频,
00:05:16它就会使用 FFmpeg 以特定的速率提取帧,
00:05:21具体取决于视频的长度。
00:05:22显然,如果是 60 FPS 且长达 10 分钟的视频,那将耗费惊人的
00:05:27Token 数量。
00:05:28所以它会根据视频的时长给出一个默认的帧预算。
00:05:32因此,一个 30 秒的视频会有 30 帧。如果是 10 分钟以上,
00:05:36则只有 100 帧。虽然采样比较稀疏,
00:05:38但它本质上是向 Claude Code 提供截图。
00:05:42它通过 Whisper 获取音频,并将这两者结合起来,
00:05:47从而实现“看”视频。现在,
00:05:49我认为这是一个非常有用的工具,因为在处理视频方面,
00:05:53目前对于 Claude Code 或 Codex 来说,实际上只有另外两条路径,
00:05:56那就是,好吧,
00:05:58直接把它发给 NotebookLM 之类的东西让它去解决,或者
00:06:03属于同一类的方法:通过 API 调用调用 Gemini,
00:06:08然后就这样发送过去。这给了我们一种,
00:06:13不同的方法,我们不必依赖 Gemini 来为我们处理这些视频,
00:06:17因为我们要通过截图来分解它。
00:06:19显然,当我们谈论更长的视频(3 分钟以上、10 分钟以上)时,
00:06:23你会遇到问题。
00:06:24比如你到底想用这些视频做什么?
00:06:26但我认为,任何能让我们更接近让 Claude Code
00:06:30能够处理视频的工具,都是未来值得尝试的好工具。现在,
00:06:34四号工具是我最近做过视频的一个,那就是 Open Design,
00:06:37它本质上是 Claude Design 的开源克隆版。
00:06:42你现在可以配合任何编程智能体来使用 Claude Design,
00:06:46或者与之非常接近的东西。所以你可以完全在本地免费使用。
00:06:50你甚至不需要在 Claude Code 上。
00:06:51他们完全复制了 Claude Design 的布局,包括创建
00:06:55原型、幻灯片,并添加了一些额外的功能,
00:06:58比如还可以调用 API 进行图像创建和视频创建,
00:07:03而 Open Design 本身是基于另外四个开源工具构建的。
00:07:07第一个是 Who-Wash-You Design,
00:07:09它基本上是另一个 Claude Design 的克隆,
00:07:12但它纯粹是在终端内部运行的,还有 Guzheng PowerPoint 技能。
00:07:17它允许我们创建这些 PPT,然后能够真正地
00:07:20正确提取它们,以及 Open Code Design 和 Multi-Game。
00:07:24它整合了这四个工具,加上 31 个技能包,瞧,
00:07:28我们基本上拥有了本地版的 Claude Design。
00:07:30所以如果你是那种非常喜欢 Claude Design 的人,
00:07:32特别是它的图形用户界面部分,
00:07:36我强烈建议去看看这个。
00:07:37尤其是当你本周的使用限制已经用完的时候。现在,
00:07:40如果你很在意你的 Token 都用在哪了,以及每个月
00:07:43在这些编程工具上花了多少冤枉钱,
00:07:46那么你会喜欢五号工具:CodeBurn。
00:07:49CodeBurn 跟踪 16 种 AI 编程工具的 Token 使用成本和性能,
00:07:54让我们能够更清晰地看到 Token(也就是我们的钱)流向了哪里,
00:07:59这远比你在
00:08:01Claude Code 内部使用 forward slash usage 命令得到的信息要多。
00:08:04在这个仪表盘中你可以看到,它按活动、项目、模型、
00:08:09核心工具、Shell 命令、
00:08:10MCP 服务器进行分类,不仅显示了我们使用了多少 Token,
00:08:13还显示了具体的美元金额,这非常重要,
00:08:16特别是如果你在使用 API 的话。现在,
00:08:17比告诉我们 Token 用在哪以及我们是如何赔钱的更重要的,是它提供了解决问题的方法。
00:08:20它告诉我们如何优化系统。这样我们就不会再烧掉这么多 Token 了。
00:08:23所以就像 Caveman 一样,
00:08:28我认为 CodeBurn 也是那种几乎百利而无一害的轻量级工具。
00:08:29所以一定要看看这个。六号工具是 Impeccable。
00:08:33Impeccable 是几个月前推出的,
00:08:36但他们上周刚发布了 3.0 版本,
00:08:39这就是为什么我想把它包含进来,因为 Impeccable 的更新
00:08:43包含了在浏览器中实际编辑前端设计的能力。
00:08:46如果你现在还不明白的话,
00:08:51Impeccable 是一个前端设计工具。Impeccable 只附带了一个技能。
00:08:52但那一个技能就包含了 23 个不同的命令,全部都是为了
00:08:57确保你的网页不会太烂。
00:09:01我喜欢 Impeccable 的一点是它包含了一个网站,我可以在上面实际看到
00:09:03每一个命令的作用。
00:09:06它展示了前后对比,你可以看到:好吧,
00:09:08如果我使用这个技能,实际会发生什么?此外,
00:09:11它现在有一个实时模式,你可以直接打开你的网页,
00:09:15点击不同的组件,然后在浏览器上
00:09:19尝试不同的变化。
00:09:23我其实针对这个做过一次深入探讨,如果你想
00:09:24看它的实际运行效果,我会把视频链接放在上面。
00:09:28但我认为,可以说最棒的部分可能就是它的网站,以及
00:09:29能够看到所有这些前后对比,为你提供灵感,比如:
00:09:32好吧,这就是我的 AI 垃圾作品的样子,对比它应该有的样子,
00:09:36并看到你可以对单个组件进行微调的各种方式,
00:09:36但从整体上看,这真的能改变你网站的外观和感觉。
00:09:41再强调一次,这个实时模式刚刚发布。
00:09:45所以如果你以前用过没有这个功能的 Impeccable,强烈建议你
00:09:48再看一眼。那么,继续前端设计的主题,
00:09:50七号工具是 Design Extract。
00:09:54不久前出现的一个大库,我以前也提到过,
00:09:58就是 awesome-design.md。
00:10:00自从大约两个月前首次推出以来,awesome-design.md 就火了。
00:10:04它已经获得了 70,000 颗星。它的核心想法是,
00:10:06他们为我们提供了所有这些热门网站的资源库,例如,
00:10:11ElevenLabs。
00:10:14我点击它,基本上可以看到关于他们网站外观的
00:10:18完整美学分析。你知道的,卡片样式是什么,
00:10:19颜色是什么,间距、字体等等。
00:10:24awesome-design.md 的问题在于我只能从这些里选。我的意思是,
00:10:27虽然有很多选择,但我能做的事情还是有限的。
00:10:30Design Extract 更进一步,因为它基本上允许我们
00:10:35获得我在 design.md 内部向你展示的同样的东西,
00:10:38但是针对任何我们想要的网站。
00:10:43因此,我们将这个设计工具对准任何我们想作为灵感、
00:10:47作为构建基础的网站。
00:10:49它会抓取布局系统、响应性、交互状态、
00:10:52动画、语言、组件解构、品牌语调等等。
00:10:54这样我们就得到了一个全面的内容,然后可以带入 Claude Code 并结合我们的品牌进行构建。
00:10:57动态、语言、组件解构、品牌语调等等,不胜枚举。
00:11:01这样我们就拥有了一个全面的参考,可以将其导入 Claude Code 并结合我们的品牌
00:11:06进行后续开发。
00:11:07它是通过使用无头浏览器来抓取所有这些信息的,
00:11:10从而实现这一功能。
00:11:11所以这比随便截几张图然后说“嘿,照着这个抄”要高级得多。
00:11:16如果你非常喜欢 Awesome Design 这个仓库,
00:11:19但希望这里有更多能供你参考的网站,
00:11:23那么一定要试试 Design Extract。
00:11:26如果你曾想过用 Claude Code 来辅助求职,或者整理简历,
00:11:30那你一定会喜欢这个工具。
00:11:32它就是 Career Ops,功能如其名。正如他们所言,
00:11:36Career Ops 能将任何 AI 编程 CLI 转换成功能完备的求职指令
00:11:41中心。它能评估市面上的职位邀约。
00:11:44生成量身定制的 PDF,批量扫描门户网站的进度,
00:11:48并基本上追踪求职过程中涉及的所有事项,
00:11:52这个过程通常很折磨人。而且更重要的是,
00:11:53这并非那种只会海投的工具。它不是那种“哦,
00:11:58去 LinkedIn 把全世界每一个职位都投一遍”的玩意儿。
00:12:01它更像是一把手术刀。
00:12:02它会根据职位调整你的简历,并确保你关注的职位
00:12:07确实适合你。这不仅仅是说“好吧,
00:12:09去那儿随手乱投一通”。在底层,
00:12:14它使用 Playwright 来实际导航页面。
00:12:17它根据你的简历评估匹配度,然后针对每个列表进行适配。
00:12:21通用流程是这样的:你粘贴一个职位的 URL 或描述。
00:12:25然后它会对其进行分类,接着判定
00:12:28你是否匹配,之后再生成报告、PDF,
00:12:32并更新追踪器。所以这绝对是一个实用的工具,
00:12:34如果你或你认识的人正试图利用 Claude Code 之类的工具来辅助求职。
00:12:38现在,第 9 个工具是
00:12:41我觉得你之后会经常听到的,那就是 Browser Harness。
00:12:44可以把它想象成每次运行后都会自我改进的 Playwright。
00:12:48它的工作方式大致是,如果我用 Browser Harness 去
00:12:52在亚马逊上做点什么,
00:12:54作为这个自主浏览器代理,它每次去亚马逊完成任务时,
00:12:59都会更新自己的代理技能文件,记录下“好吧,
00:13:02这是我们在亚马逊上做的,这里哪些有效,哪些无效”。
00:13:05从某种意义上说,这几乎像是一个微型的 RAG 循环,我们给它一个任务。
00:13:09它总是会更新文件来查看“嘿,成功了吗?没成功吗?
00:13:13我们已经尝试过什么了?”然后再次尝试,
00:13:15基于它记录的关于自身的信息以及这种自我修复
00:13:20机制。它还很新,刚发布了几周时间。
00:13:23目前只有不到 1 万个 Star,
00:13:24但我认为这种针对浏览器代理的代理化方法,
00:13:30是你会经常看到的。至于列表上的最后一个工具,我有点“作弊”了,
00:13:33因为它在技术上并不完全是开源的。
00:13:35甚至 n8n 本身在技术上也不是完全开源的。它是公平使用协议,但你知道的,
00:13:40你可以本地使用。所以这有点复杂。它就是 n8n MCP 服务器。
00:13:44虽然我觉得 n8n “已死”的说法被大大夸大了,但平心而论,
00:13:48它确实不再处于六个月前那个位置了。不过,
00:13:52他们已经开始意识到并转型为 Claude Code 可以
00:13:57非常轻松使用的工具,尤其是通过这个全新的 MCP 服务器。
00:14:01这个 MCP 服务器与市面上已有的其他 n8n MCP 服务器略有不同,
00:14:05因为虽然已经出现过几个,而且它们是开源的,
00:14:09但区别在于这一个是使用 TypeScript 的,而不是仅尝试自动
00:14:12生成 JSON 文件。所以我给这个 n8n MCP
00:14:16发送一些指令,比如“帮我构建任何自动化流程”,它随后会用
00:14:21TypeScript 来构建,这让它能够实际校验该自动化,查看“嘿,
00:14:25这些节点合理吗?这真的能跑通吗?”然后作为最后一步,
00:14:30它会被转换为 JSON,并填充到你的实例中。
00:14:33如果你像我一样仍然非常喜欢 n8n,并且确实有它的使用场景
00:14:38(虽然可能有点小众),那这绝对是个绝佳的工具。
00:14:40它几天前才发布,我也专门为此做了一个完整的视频。
00:14:43我会把链接放在上方。
00:14:44以上就是我最喜欢的 10 个适配 Claude Code 的开源工具,它们都是在
00:14:49过去一个月左右发布的。就像我说的,
00:14:51这个领域时刻都在变化。想要跟上脚步几乎是不可能的。
00:14:55所以我希望通过观看这个视频,你能至少发现其中几个
00:14:58你想去尝试的工具。一如既往,请告诉我你的想法。
00:15:01如果你想参加大师课,请务必查看 Chase AI Plus。
00:15:04除此之外,我们回头见。

Key Takeaway

2026 年 5 月涌现的一系列开源工具通过简洁约束提升模型准确性、知识图谱降低 71.5 倍 Token 消耗以及多模态处理能力,显著优化了 Claude Code 的开发效率与成本。

Highlights

  • Caveman Skill 在发布首月获得超过 50,000 颗星,通过强制 Claude Code 简洁回复可将输出 Token 缩减约 5%。

  • 2026 年 3 月的论文《简洁约束》证实,强迫强大的大语言模型保持简洁能有效提升其回答的正确率。

  • Graphify 能够读取文件构建知识图谱,相比阅读原始文件,每次查询的 Token 消耗量降低了 71.5 倍。

  • Claude Video 通过 FFmpeg 按视频时长自动提取帧预算,30 秒视频提取 30 帧,10 分钟以上则限制在 100 帧。

  • CodeBurn 可跟踪 16 种 AI 编程工具的成本与性能,并按模型、MCP 服务器和 Shell 命令等维度显示具体的美元金额。

  • Design Extract 利用无头浏览器抓取任何网站的布局系统、响应性、组件解构和品牌语调,为 Claude Code 提供构建参考。

  • Browser Harness 具备自我修复机制,每次执行亚马逊等站点任务后都会更新代理技能文件以记录有效路径。

Timeline

Caveman Skill 与简洁约束理论

  • Caveman Skill 提供轻量、完全、极致三种模式来强制缩减 Claude 的输出长度。
  • 强制简洁能防止模型因冗余信息过多而陷入逻辑错误。
  • 该工具的安装仅需在 Claude Code 中运行库命令或复制 URL。

Caveman Skill 核心在于改变输出的词数而非思考方式,虽然总 Token 节省仅约 5%,但其真正的价值在于质量提升。基于 2026 年的学术研究,当强大模型受限于简洁回复时,其表现往往优于不受限状态。用户可以根据需求选择不同程度的原始人说话风格,从而直接切入问题核心。

Graphify 知识图谱与 Claude Video 多模态处理

  • Graphify 具备处理 PDF、截图和图表的多模态能力,不依赖传统的嵌入向量。
  • Claude Video 通过结合视觉帧采样与 Whisper 音频提取实现视频理解。
  • 帧预算机制根据视频长度自动调整采样率以平衡 Token 成本。

Graphify 位于 Obsidian 与完整 RAG 系统之间,通过结构化文件内容显著降低查询成本,适合需要底层内存动力但不希望处理复杂嵌入的用户。Claude Video 则为不支持原生视频输入的 Sonnet 和 Opus 模型提供了替代路径。它通过将视频分解为特定数量的截图发送给 Claude Code,规避了必须调用 Gemini API 的限制。

Open Design 开源克隆与 CodeBurn 成本监控

  • Open Design 整合了四个开源工具和 31 个技能包,提供本地免费的 UI/UX 设计环境。
  • CodeBurn 能够实时显示每个项目和活动所消耗的具体美元金额。
  • 成本仪表盘提供了针对特定工具和模型的优化建议以减少支出。

Open Design 复制了 Claude Design 的布局并增强了 API 调用功能,支持原型和幻灯片创建,适合在云端额度用尽时切换至本地使用。CodeBurn 则解决了开发者对 AI 工具开销不透明的痛点。它比 Claude 内置的统计命令更详尽,能深入到 MCP 服务器层级分析钱流向了哪里,并提供系统优化方案。

Impeccable 3.0 与 Design Extract 网页分析

  • Impeccable 3.0 允许开发者直接在浏览器中点击并实时编辑前端组件。
  • Design Extract 能够从任何目标网站提取精细的动画、间距和交互状态数据。
  • 前端工具通过对比功能协助开发者将 AI 生成的粗糙代码优化为专业设计。

Impeccable 提供 23 个专用命令来微调网页,其新增的实时模式让设计调整变得直观。Design Extract 则打破了固定资源库的限制,利用无头浏览器技术抓取任何网页的底层设计逻辑。这使得开发者可以将竞争对手或优秀站点的组件解构后,直接作为品牌建设的参考输入到 Claude Code 中。

Career Ops 求职自动化与自学型浏览器代理

  • Career Ops 使用 Playwright 导航页面并根据简历匹配度生成定制报告。
  • Browser Harness 在每次运行任务后通过更新技能文件实现自我性能优化。
  • n8n MCP 服务器采用 TypeScript 架构以确保自动化流程的逻辑校验。

Career Ops 并非海投工具,而是侧重于职位适配度评估和定制化 PDF 生成,追踪复杂的求职进度。Browser Harness 则代表了浏览器代理的新趋势,通过类似微型 RAG 的循环记录成功与失败经验,实现自主学习。最后,新发布的 n8n MCP 服务器通过 TypeScript 构建流程,能先校验节点合理性再转换为 JSON,大幅提升了自动化构建的成功率。

Community Posts

View all posts