Claude 离谱但好用的神奇技能

AAI LABS
Computing/SoftwareAdvertising/MarketingSmall Business/StartupsInternet Technology

Transcript

00:00:00许多人已经开始完善自己的智能体技能,并将其向社区开源。
00:00:05虽然他们的大多数技能确实很有用,但有些却非常古怪。
00:00:08但尽管古怪,它们却以你意想不到的方式发挥着作用。
00:00:12其中一个解决了我们在处理多个会话时面临的最大问题,
00:00:16而且它以一种既有趣又切实有效的方式做到了这一点。
00:00:18另一个则解决了 Token 膨胀问题,且解决方法让我们始料未及。
00:00:22我们不断发现更多此类技能,尽管起初听起来很荒谬,但确实很有帮助。
00:00:27它们最终都融入了我们的工作流,让一切变得比以前更有趣。
00:00:32现在,如果你像我们一样同时使用多个 Claude 会话,
00:00:36并让它们同步运行不同的任务,
00:00:39你肯定必须手动跟踪哪个会话已完成工作,哪个还没有。
00:00:43还有一些情况,你以为 Claude 已经运行了足够长的时间,
00:00:47结果打开会话一看,它却卡在了一个权限提示上。
00:00:50为此,你需要 "P on Ping",这是一个在 Claude 完成任务
00:00:55或需要权限提示时发出通知的技能,以便我们关注该会话。
00:00:58但它使用的不是标准的通知方式。
00:01:00它实际上使用了热门游戏中的配音,拥有多种模式和不同的游戏角色。
00:01:05你可以为你使用的任何编程智能体设置此功能。
00:01:08你可以根据你所使用的操作系统使用安装命令来安装并运行此插件。
00:01:13设置完成后,你可以使用斜杠命令从多个语音包中选择你喜欢的配音。
00:01:18现在,每当你给 Claude 安排任务并忙于其他事务时,
00:01:22当 Claude 完成任务,后台就会响起带有游戏角色配音的通知。
00:01:27它使用游戏中的表达方式来示意任务已完成,且会根据任务的不同而变化。
00:01:32当你开启新会话时,你也会收到语音通知,提示 Claude 已准备好工作。
00:01:37这样你就不必手动检查每一项,而是通过有趣的通知来完成相同的工作。
00:01:42我们在这个频道分享所有关于利用 AI 构建产品的工具和工作流。
00:01:47所以,如果你想看更多此类视频,请订阅并关注未来的视频。
00:01:51我们总是在谈论使用对抗性审查模式,因为它会从许多不同方面进行批判性评估,这正是其高效的原因。
00:01:58所以,这个工具包中有一个名为 "Dog Food" 的技能。
00:02:00该技能的作用是探索 Web 应用,并使用对抗性审查风格识别 Bug 和 UX 问题。
00:02:06它使用 Agent Browser,这是一个 CLI 工具,允许智能体通过发送按键和正确引用元素来与页面交互。
00:02:15我们在之前的视频中已经介绍过这一点,讨论了如何设置和使用它。
00:02:19因此,在安装此技能时,确保已安装 Agent Browser 至关重要。
00:02:24你可以提供想要测试的网站链接,或者直接告诉它测试该应用。
00:02:28你也可以提供托管的 URL 或本地主机(localhost)链接。
00:02:32完成此操作后,它会首先初始化一份报告,然后使用 Agent Browser 逐页检查你的应用。
00:02:39在完成对应用的深入审查后,它会报告发现的所有问题。
00:02:43这包括复现每个 Bug 的步骤、屏幕截图,以及高、中、低优先级问题的详细分类。
00:02:50它甚至会录制一段展示整个操作过程的视频,使其成为一份非常详尽的审查报告。
00:02:54现在,如果你对 Claude 给出不必要的长篇大论,且回答中充满了毫无帮助的激动词汇感到恼火,
00:03:02尤其是当它没能正确完成手头任务,还表现得很啰嗦时,
00:03:06Caveman 插件正是为此而生,它让 Claude 像个原始人一样说话,在保持技术准确性的同时减少了 75% 的回复 Token。
00:03:15其背后的理念是,正如原始人使用极简的词汇来表达其完整意图,Caveman 技能也是如此运作的。
00:03:23它通过使用直接的词语、删减冠词并增加切中要点的词汇,使 Claude 以更少的 Token 进行回复。
00:03:31特别是这会削减 Claude 倾向于注入的那些无关紧要的填充词,因为我们只关心任务的完成。
00:03:38该插件有不同的模式,其中最高级的是 "Wengian"(文言)模式。
00:03:42此模式使用中文而非英文,因为中文词汇能以极少的 Token 代表整个句子,而英文则需要多得多的 Token 来表达相同的意思。
00:03:52但在切换到中文之前,请记住,模型在非英语语言上的准确性通常较低,
00:03:59因此最好还是使用英文的 Caveman 语言,而不是 Wengian。
00:04:02使用该插件的主要好处是你收到的回复更容易阅读且不失准确,因为只有废话被删除了,Claude 依然能传达重点。
00:04:13它适用于所有主流智能体,但对于 Claude Code,你需要先安装插件市场命令并运行。
00:04:20插件市场安装完成后,你可以运行插件命令,搜索 Caveman 并安装在你想要的任何作用域中。
00:04:27安装后,重载插件即可使用该功能。
00:04:30你可以通过使用 caveman 命令并指定你想要的强度级别来设置其强度。
00:04:35从那一刻起,所有的解释都将直接切入正题。
00:04:39因此,如果你要求它解释应用的任何特定部分,它会用更少、更易理解的词汇来解释应用的方方面面,
00:04:48通常还会使用箭头以比没有此插件时更紧凑的方式解释整个流程。
00:04:54现在,如果你使用 git 跟踪项目,并将其作为追踪项目进度的知识库,你可以使用名为 "Git Time Travel" 的技能。
00:05:02它基本上赋予了你的智能体导航 git 历史的专长,使其能够像时间旅行日志一样理解整个历史。
00:05:09安装该技能时,会同时安装 skill.md 文件以及包含模式和验证的附加参考资料。
00:05:16这些会检查不同类型的问题,例如强制推送到主分支或在没有适当备份的情况下进行变基,这些操作以后可能会导致问题。
00:05:23你可以使用此技能分析 git 日志中出现的任何问题。
00:05:27一旦你提供了提示词,它就会遵循技能文件中的指令。
00:05:30在像时间旅行一样回顾了整个历史后,它会给出一份详细的报告。
00:05:34它会指出所有出错的地方,并提供建议和需要关注的领域。
00:05:39但在我们继续之前,先来听听我们赞助商 FreeBuff 的介绍。
00:05:42当你正忙于构建,而你的编程智能体却在卡顿、耗尽额度,并且每个命令都要征求权限。
00:05:48FreeBuff 则省去了这一切。
00:05:49FreeBuff 是一款免费的编程智能体,速度比 Claude Code 快 10 倍。
00:05:53除了苹果原生终端外的任何终端均可使用,运行此命令即可搞定。
00:05:58无需订阅,无需配置,它由简单的文本广告资助,因此不花你一分钱。
00:06:02假设你正深陷于一个项目,需要在浏览器中进行测试、审查代码或搜索代码库。
00:06:08FreeBuff 有 9 个子智能体可以介入并以每秒 300 Token 的速度处理这一切。
00:06:13当你完成了一项任务却不知道下一步该做什么时,
00:06:15它会弹出 3 个后续提示词,你只需点击即可继续。
00:06:19你还可以连接你的 ChatGPT 订阅,为计划和审查功能解锁 GPT 5.4。
00:06:25你的代码库不会被存储,也不会有任何东西用于训练你的数据。
00:06:27今天就免费试用 FreeBuff 吧。
00:06:29链接就在置顶评论中。
00:06:30现在,如果你正在开发一款应用,并希望在上线前识别出问题,可以使用该技能包中的 "Pre-mortem" 技能。
00:06:38它的作用是查看代码库,识别所有脆弱区域,并预测当前实现可能出现的潜在问题。
00:06:45它从不同角度分析代码,然后为尚未发生但在应用将来上线生产环境时有可能发生的 Bug 撰写正式且切实的报告。
00:06:56安装该技能后,你会得到一个 skill.md 文件,详细说明了识别应用问题所需的一切。
00:07:02这包括完整的工作流、应如何处理不同方面,以及报告时需要检查哪些模式。
00:07:08而且这个目录非常详尽。
00:07:10报告还遵循一种正式的格式,定义了应如何记录所有内容。
00:07:14你可以在安装了该技能的任何项目中使用它。
00:07:17只需运行 pre-mortem 命令,它就会开始分析代码库,并在分析完成后生成详尽的报告。
00:07:24它还可能会询问你想要重点关注哪些方面。
00:07:27最终报告将包含当前代码库中存在的所有 Bug 以及未来可能出现的问题,以便你能及时采取行动。
00:07:35在同一个资源技能包中,还有一个名为 "Mutation Testing"(变异测试)的技能。
00:07:40它会分析你的整个测试套件,并通过一次引入一个不同类型的 Bug 和变异来对其进行评估。
00:07:46它会检查测试用例是否足够强大以捕获这些问题。
00:07:49它在代码中制造变异,然后将其还原,分析其中的差距并生成包含建议更改的报告。
00:07:55运行该技能后,它首先会分析项目结构,找到测试文件,然后逐一测试它们。
00:08:02由于它使用 Git 来还原变异,它会确保事先提交了所有更改。
00:08:08它会将更改应用于不同的组件,并检查测试是否正确检测到了这些更改,从而验证所有测试文件是否编写妥当。
00:08:16在完成所有检查后,它会生成一份带有变异分数的完整报告。
00:08:21它会列出未捕获的问题,并建议改进措施,以使测试套件更加完整和可靠。
00:08:27现在,还有一个名为 "The Fool"(愚者)的技能。
00:08:30该技能会批判性地分析并压力测试某个想法、计划、决策或提案。
00:08:35它通过多种模式和故事来帮助你理解你所采取的方向是否真的正确,以及是否具有长期可持续性。
00:08:42它有多种模式供你选择。
00:08:44安装此技能后,它会将针对不同模式的所有 skill.md 文件和参考资料引入你的项目。
00:08:51你可以使用该命令并提供任何你想要挑战的内容。
00:08:54它首先会询问你希望如何挑战这个想法,你可以选择任何选项。
00:08:58根据你的选择,它会从技能中加载相关的参考资料,以便进行相应的推理。
00:09:03在流程结束时,它会生成一份包含多种失败模式的详细报告。
00:09:08它会解释事情可能会失败的原因,以及这些失败链条可能导致的后果。
00:09:13然后它会以结构化的顺序展示所有发现。
00:09:15你可以反驳它的分析并与其进行迭代,在过程中完善你的想法。
00:09:20此外,如果你喜欢我们的内容,请考虑按下赞赏按钮,因为这能帮助我们创作更多此类内容并触达更多受众。
00:09:27现在,如果你尝试过通过 Claude Code 在 Reddit 上进行研究,你可能已经注意到 Reddit 会屏蔽像 Claude Code 这样的机器人,导致难以访问内容。
00:09:35而 Reddit 是用户输入最重要的来源之一,因为很多人会去那里分享评价并讨论各种问题。
00:09:42因此,如果你正在研究市场,来自 Reddit 的输入就非常关键。
00:09:45为此,有一个技能包包含了一个名为 "Reddit Fetch" 的技能。
00:09:49该技能的作用是使用 Gemini CLI 或 curl 后备方案从 Reddit 获取内容,从而更可靠地访问 Reddit。
00:09:57它的工作原理是首先尝试通过 TMUX 使用 Gemini CLI。
00:10:01TMUX 是一个终端复用器,允许你在一个会话中生成多个终端并并行处理多个任务。
00:10:08如果该方法失败,它会退而使用 curl JSON API。
00:10:12该技能提供了有关如何正确使用这两种方法的详细说明。
00:10:16安装此技能后,你就可以使用它并指定你想要在 Reddit 上研究的话题。
00:10:21最后,它会提供一份详细报告,说明 Reddit 用户对该话题或问题的真实看法。
00:10:26现在,既然大家都知道智能体在构建 UI 时倾向于趋向共同的模式,它们往往最终都会使用同样的紫白配色方案。
00:10:35因此,这里有一个名为 "Color Expert" 的技能,它充当指南并为智能体提供对色彩科学的理解。
00:10:41它涵盖了 WCAG、调色板等不同方面。
00:10:44现在你可能会想,既然已经有这么多 UI 技能了,这个有什么不同呢?
00:10:49但这个技能的不同之处在于它包含多个参考资料,拥有 100 多个 Markdown 文件,提供了关于哪些是正确 UI 选择、哪些不是的详细指导。
00:10:59这些参考资料收集自多个可靠来源,包括维基百科、YouTube 脚本等。
00:11:05所以,我们在我们的应用(一个社区落地页)上测试了它。
00:11:08智能体首先加载了该技能,正确理解了代码库和指南,然后开始按照技能中列出的模式来实现应用。
00:11:16当它完成时,你可以看到它生成的 UI 更加平衡,合理地利用了留白和其他元素。
00:11:22它使用了更具互动性和吸引力的调色板,并将注意力引导至关键内容。
00:11:28总的来说,尽管我们的提示词很简单,但相比没有该技能的情况,网站得到了显著改善。
00:11:34视频到这里就结束了。
00:11:35如果你想支持本频道并帮助我们继续制作此类视频,可以点击下方的 "Super Thanks" 按钮。
00:11:42一如既往,感谢观看,我们下期再见。

Key Takeaway

通过集成 Caveman、Color Expert 和 Mutation Testing 等专项 MCP 技能,Claude 可以在显著降低 75% Token 成本的同时,实现具备色彩科学依据的 UI 自动优化以及针对代码稳健性的全自动压力测试。

Highlights

Caveman 插件能将 Claude 的回复 Token 消耗降低 75%,并在保持技术准确性的同时消除冗长的填充词。

Wengian(文言)模式利用中文极高的信息密度,通过极少的 Token 承载整句含义,进一步优化模型效率。

P on Ping 技能通过集成热门游戏角色配音,在 Claude 完成长时任务或遇到权限提示时发出语音通知。

Color Expert 技能包含 100 多个 Markdown 参考文件,为 AI 智能体提供符合 WCAG 标准的色彩科学和 UI 布局指导。

Mutation Testing 技能通过在测试套件中主动引入变异(Bug),验证代码测试用例的覆盖完整度与可靠性。

FreeBuff 编程智能体在无订阅、无配置的情况下,运行速度比 Claude Code 快 10 倍,且支持每秒 300 Token 的处理速度。

Timeline

任务状态的语音通知系统

  • P on Ping 技能解决了多会话运行时手动跟踪进度的繁琐问题。
  • 该系统在任务完成或需要权限提示时播放热门游戏角色的配音通知。
  • 安装后可通过斜杠命令在多个语音包之间切换以定制通知风格。

用户在运行多个 Claude 智能体执行不同任务时,往往难以实时掌握每个会话的进度。P on Ping 允许用户在后台忙于其他事务,当 Claude 准备就绪或卡在权限提示时,系统会根据任务性质自动播放相匹配的游戏术语配音。这不仅替代了枯燥的标准系统通知,也避免了因频繁手动检查而中断工作流。

基于对抗性审查的 Bug 检测

  • Dog Food 技能利用 Agent Browser 通过模拟按键和元素引用与 Web 页面交互。
  • 该工具能够识别 Bug 与 UX 问题,并按优先级对高、中、低风险项进行分类。
  • 系统会自动生成包含复现步骤、屏幕截图甚至操作录屏的详尽审查报告。

通过 CLI 工具 Agent Browser,智能体能够像真实用户一样探索本地或托管的 Web 应用。Dog Food 技能采用对抗性审查风格,在深入扫描每个页面后,会提供一份标准化的技术报告。这份报告不仅指出缺陷,还通过多媒体手段记录整个交互流程,方便开发人员直接复现和修复潜在的交互漏洞。

降低 75% Token 消耗的极简模式

  • Caveman 插件通过模拟原始人语序,删减冗余冠词和填充词以节省 75% 的 Token。
  • Wengian 模式利用中文的高信息密度特性提供极致的 Token 压缩率。
  • 该技能在缩短回复长度的同时,使用箭头符号使解释流程更紧凑易读。

针对 Claude 容易出现冗长解释的问题,Caveman 技能强制模型直接切入正题。它提供多种强度级别供用户通过命令调节,并在技术解释中用简练词汇替代长篇大论。虽然文言模式(Wengian)在 Token 压缩上表现更佳,但由于模型在非英语环境下准确性可能下降,建议优先使用英文版 Caveman 以确保核心逻辑的准确表达。

Git 历史分析与上线前风险预测

  • Git Time Travel 技能赋予智能体导航 Git 历史、识别强制推送或风险变基的能力。
  • Pre-mortem 技能通过分析代码库预测应用上线生产环境后可能出现的漏洞。
  • 分析完成后系统会生成遵循正式格式的报告,标记所有脆弱区域并提供改进建议。

Git Time Travel 将版本库转化为可感知的知识库,帮助智能体理解项目的演进逻辑并拦截危险的版本操作。与之配合的 Pre-mortem 技能则在代码上线前进行模拟评估,通过 skill.md 文件中定义的标准工作流,系统会审查所有脆弱的实现逻辑,并以正式文档的形式列出未来可能引发故障的隐患点,供开发者在问题发生前提前介入。

变异测试与想法压力测试

  • Mutation Testing 技能通过在代码组件中逐个注入 Bug 来评估测试套件的拦截率。
  • The Fool 技能使用多种失败模式模型来挑战用户的决策、计划或提案。
  • 测试过程会计算变异分数(Mutation Score),并生成带有链式反应分析的失败模式报告。

变异测试技能通过自动修改代码并观察现有测试用例是否报错,来衡量测试套件的真实效用,确保没有测试盲区。与此同时,The Fool 技能充当了理性的反方角色,通过加载特定的参考资料,它会对用户的想法进行多维度的压力测试。这种迭代式的反驳过程能揭示计划中潜在的长期不可持续性,帮助用户在正式实施前完善逻辑闭环。

Reddit 调研与色彩科学应用

  • Reddit Fetch 技能利用 TMUX 和 Gemini CLI 绕过 Reddit 对机器人的限制。
  • Color Expert 技能依靠 100 多个 Markdown 文件指导智能体生成平衡的 UI 调色板。
  • 集成了 UI 指南的智能体在留白处理、留存率优化和交互吸引力方面表现显著提升。

针对 Reddit 屏蔽爬虫的问题,Reddit Fetch 提供了可靠的 API 或 curl 后备方案,确保智能体能获取真实的市场用户评价。而在 UI 构建方面,Color Expert 技能纠正了智能体倾向于使用通用紫白配色方案的习惯。通过引入来自维基百科和专业视频脚本的 UI 规范,智能体能自动生成符合色彩科学、布局更合理且更具品牌吸引力的社区落地页。

Community Posts

No posts yet. Be the first to write about this video!

Write about this video