00:00:00AI 智能体是在变弱,还是仅仅因为获取的信息有误?
00:00:03智能体面临的核心问题在于其上下文环境。
00:00:06这并不是说智能体缺乏信息或记忆力不好,
00:00:09而是因为它们没有基于受控的“事实来源”进行落地。
00:00:12这意味着,处理错误信息才是它们表现如此糟糕的原因。
00:00:15现在你可能已经听说过 Google 的 NotebookLM,
00:00:18这是一款研究能力极强、还能生成播客的工具。
00:00:22但如果它的功能远不止于此呢?
00:00:23我们的团队尝试从多个维度测试这款研究工具,
00:00:27试图寻找将其融入我们开发工作流的方法,
00:00:30老实说,我们没指望它能融合得这么好。
00:00:32在整个视频中,我们的团队通过 CLI 工具来使用 NotebookLM。
00:00:36这是一个产品接口,让你能够完全掌控
00:00:39笔记本管理、源文件以及根据笔记本来源生成的音频回顾。
00:00:44安装过程非常简单,只需一条命令即可搞定。
00:00:47安装完成后,你可以运行帮助命令来验证安装情况。
00:00:51这将显示所有可用于控制 NotebookLM 来源的命令、
00:00:56处理多模态输入,以及该工具可以执行的所有功能。
00:01:00但在使用之前,请使用 “NLM auth” 命令通过你的 Google 账号对 CLI 进行授权。
00:01:05运行后会打开一个 Chrome 窗口供你登录。
00:01:08之后,NLM 会保存你的凭据以便日后使用。
00:01:11可以通过 CLI 和 MCP 访问 NotebookLM,
00:01:15两者由同一位开发者构建,你可以根据喜好选择。
00:01:18我们选择了 CLI,因为它的 Token 利用率更高,
00:01:21在运行长周期任务时也不会出现问题。
00:01:24我们可以将 NotebookLM 作为 AI 智能体的“第二大脑”,
00:01:27为其提供代码库信息,并让它在运行过程中同步记录文档。
00:01:31为了实现这一点,我们在 claud.md 文件中添加了指令,
00:01:35告诉它所有的项目知识、架构决策
00:01:38以及所有其他文档都应存储在笔记本中。
00:01:41这个笔记本就是唯一的“事实来源”。
00:01:43我们利用 Claude 通过 CLI 工具创建了笔记本,并将 ID 保存在 claud.md 中。
00:01:49因此,当我们开发应用功能时,会先使用“计划模式”进行规划。
00:01:53实现之后,一旦构建通过,
00:01:55它就会按照指令,将功能实现细节更新到笔记本中。
00:01:59创建的笔记本包含了 Claude 在整个过程中所做的所有决策。
00:02:03将其设置为第二大脑意味着 Claude 无需自行搜索大量文档,
00:02:08避免了通过模式匹配阅读而导致上下文被无关信息充斥。
00:02:12相反,它依靠 NotebookLM 的 RAG 能力来精准获取所需内容。
00:02:16这样 Claude 得到的是由 Gemini 综合出的答案,而非原始数据堆砌,
00:02:20使其能够更专注于开发和实现。
00:02:23你还可以与任何人分享这个笔记本,
00:02:25他们可以利用 NotebookLM 的功能来确认实现是否符合需求,
00:02:31即使是非技术人员,也能按照自己的节奏理解技术细节。
00:02:35NotebookLM 专为跨多源研究而设计。
00:02:39由于我们已经经常使用 Claude Code 进行研究,
00:02:42我们就提供研究课题并让 Claude 寻找来源,
00:02:47创建新笔记本并将其上传到那里。
00:02:49它识别了所有来源,并将它们上传到为该任务创建的笔记本中。
00:02:53直接用 Claude 研究会消耗大量上下文,因为它会浏览一些后来被证明无关的链接。
00:02:59将研究分为两步,让专门的工具处理,既节省了时间又节省了 Token。
00:03:05来源存入笔记本后,我们清除上下文以移除研究背景,
00:03:11然后让 Claude 通过 CLI 在 NotebookLM 上查找信息,
00:03:15找到包含 RAG 管道研究的那份,并通过 NotebookLM 对话获取核心发现。
00:03:20Claude 使用 CLI 工具获取笔记本,发送对话消息获取核心发现并返回结果。
00:03:26这比常规的 Claude 研究要快得多。
00:03:29使用笔记本的好处在于,如果我们需要该研究的更多信息,
00:03:34我们可以随时回到笔记本中,因为来源已保存在那里。
00:03:37所以 Claude 不必重新搜索,因为这些研究已在外部可用。
00:03:41如果只用 Claude,除非重复研究并让它重新查询,
00:03:45否则我们无法再次引用这些来源。
00:03:49而这种方式允许我们在未来的运行中复用它们。
00:03:52理解一段不是你写的代码是开发中最困难的部分。
00:03:57为了简化这一过程,我们也使用了 NotebookLM。
00:04:00具体操作是,我们让 Claude 使用 GitHub CLI 克隆仓库。
00:04:04仓库克隆完成后,我们让它使用 RepoMix 为该仓库生成一份文档。
00:04:09RepoMix 是一款能将代码库打包成 AI 友好格式的工具。
00:04:14你可以使用 Web 界面将代码转换为多种格式的文档,
00:04:18方便 AI 以节省 Token 的方式轻松理解代码库。
00:04:23不过我们使用的是 RepoMix 的 CLI 版本。
00:04:25我们通过 NPM 安装了它。
00:04:26安装完成后,RepoMix CLI 即可全局使用。
00:04:29于是我们让 Claude 通过 CLI 工具在 NotebookLM 上创建一个笔记本,
00:04:34并将格式化后的文档添加为该笔记本的来源。
00:04:37在克隆仓库后,它使用 RepoMix CLI 工具将代码转换为高 Token 效率的文档,
00:04:44然后创建新笔记本并以 TXT 格式添加来源。
00:04:47现在来源已添加完毕。
00:04:49我们让 Claude 使用笔记本工具对代码库进行可视化,
00:04:52创建能帮我们理解代码库内容的图表。
00:04:56它运行了一系列可视化命令。
00:04:58图表完成后,我们可以在 NotebookLM 的工作室中查看它们。
00:05:03它创建了一个地图集,作为项目核心运行机制的指南。
00:05:07它为应用的各个方面创建了完整的思维导图,
00:05:09并允许我们就每个部分进行单独对话。
00:05:12还生成了一些信息图,将不同维度可视化,
00:05:16使理解代码库变得更加直观,
00:05:19而不是仅仅依赖 Claude 的文字回答。
00:05:21在继续之前,先听听我们赞助商 Make 的简短介绍,
00:05:25这是一个赋能团队充分释放潜力、
00:05:28通过 AI 构建并加速业务发展的平台。
00:05:31众所周知,自主智能体最大的风险在于“黑箱问题”。
00:05:35你部署了它们,却无法验证它们的决策。
00:05:37Make 解决了这个问题,它将 AI 辅助的无代码能力
00:05:41与 3,000 多个预建应用相结合,为你提供真正的“玻璃箱”方案。
00:05:46在本视频中,我使用了他们预建的市场研究分析智能体,
00:05:49来展示你如何最终实现有掌控的规模化。
00:05:52除了 MakeGrid、MCP 和高级分析等强大工具外,
00:05:56真正的重磅功能是其推理面板。
00:05:58它让你能步进式观察智能体的逻辑,
00:06:01利用知识库功能落实其响应,
00:06:03并直接在画布上通过聊天工具进行实时调试。
00:06:06这就是开发者们梦寐以求的透明度。
00:06:09别再瞎猜了,开始有控制地扩展规模吧。
00:06:11点击置顶评论中的链接,立即体验全新的 Make 智能体。
00:06:15每当 AI 遇到其知识库之外的问题时,
00:06:18它会通过网络搜索并筛选资源来寻找解决方案。
00:06:22于是我们想,能不能完全跳过网络搜索,
00:06:25用一个专门的知识库取而代之?
00:06:27网络搜索的问题在于,Claude 会拉取大量来源,
00:06:30但其中只有少数是真正有用的。
00:06:32其余的只是在浪费 Token。
00:06:33因此,我们让 Claude 在 NotebookLM 上创建一个新笔记本,
00:06:37并添加来自官方文档、社区、
00:06:40以及各大平台的解决方案作为来源,
00:06:41使这个笔记本成为调试的首选之地。
00:06:44它创建了笔记本并开始寻找可添加的来源。
00:06:48最后,笔记本汇集了官方文档、
00:06:50社区论坛、GitHub 仓库、博客以及其他相关参考资料,
00:06:55构成了一个处理调试问题的知识库。
00:06:58我们将该笔记本的 ID 添加到了 claud.md 文件中,
00:07:01并告诉 Claude 在遇到任何调试问题时将其作为首选来源。
00:07:05我们还添加了一条指令:每当遇到 Bug,
00:07:08在搜索网络之前应先查阅该笔记本。
00:07:11有了这个机制,每当它遇到错误时,
00:07:13例如项目中使用了已弃用的中间件,
00:07:16它的处理方式就不同了。
00:07:18按照平时的处理逻辑,
00:07:19它会先抓取文档,然后利用文档修复问题。
00:07:23但现在,它只是向笔记本咨询了一个具体问题,
00:07:26即如何迁移到最新的代理,
00:07:28仅通过笔记本就获取了结构化的回复,
00:07:31而无需从整个互联网抓取结果。
00:07:33现在,这个 claud.md 以及所有其他资源,
00:07:36都可以在 AI Labs Pro 中找到。
00:07:38对于那些还不了解的人,这是我们最近推出的社区,
00:07:41你可以在那里获得即插即用的模板、提示词、
00:07:43以及可以直接应用到你项目中的所有命令和技能,
00:07:47涵盖本视频及以往所有视频的内容。
00:07:49如果你觉得我们的内容有价值并想支持频道,
00:07:52这就是最好的方式。
00:07:53链接就在描述栏中。
00:07:55我们通常从编写文档开始 AI 开发流程,
00:07:59所以我们也考虑将这些文档推送到 NotebookLM。
00:08:02在开发一个应用时,
00:08:04我们编写了文档,准备就绪后,
00:08:06就让 Claude 在 NotebookLM 上再创建一个笔记本,
00:08:09并将所有文档作为来源推送到该笔记本。
00:08:12它创建了笔记本并将所有来源添加到了 NotebookLM。
00:08:16有了这些来源,信息变得条理清晰且可靠,
00:08:19有助于 Claude 理解项目的方方面面。
00:08:21如果我们在与非技术人员合作,
00:08:24只需分享这个笔记本,让任何有权限的人与之对话,
00:08:27即可让他们自行理解相关内容。
00:08:28而且这个笔记本不仅能帮到 Claude。
00:08:30如果你使用 Cursor、Gemini CLI 等其他工具,
00:08:34或者有其他人与你协同开发,
00:08:36这个笔记本同样可以作为他们的知识库。
00:08:39因为通过笔记本对话,
00:08:40每个智能体都能精准获取当前所需的信息,
00:08:44而不必依靠文件工具在大堆文件中盲目搜索。
00:08:46这样,Claude 或任何其他智能体只需使用 NLM 笔记本查询工具,
00:08:51针对当前需求提问,
00:08:53并以此构建自己的上下文。
00:08:55另外,如果你喜欢我们的内容,请考虑点击“Hype”按钮,
00:08:58因为这能激励我们制作更多此类内容,
00:09:00并触达更多观众。
00:09:02刚才我们已经看到如何用它来快速熟悉代码库,
00:09:06但我们还想看看这些可视化图表是否也能帮到智能体。
00:09:10于是我们让 Claude 创建了另一个笔记本,
00:09:12并生成能帮助智能体在代码中“导航”的可视化内容。
00:09:16它创建了笔记本,添加了思维导图、信息图、数据表
00:09:20以及多个来源到 NotebookLM,
00:09:22并将它们下载到了项目的可视化文件夹中。
00:09:25它为智能体的理解提供了多种格式,
00:09:28包括 CSV 表格和 Markdown 文件,
00:09:30还包含了思维导图的 JSON 文件。
00:09:33它实际上是为所有这些功能创建了思维导图。
00:09:36就是我们刚才看到的那些导出为 JSON 的文件。
00:09:40它还创建了一套完整的演示文稿以辅助视觉理解。
00:09:43每当遇到需要检查的内容时,
00:09:46它会检查对应的思维导图,而不是在文件系统中乱撞,
00:09:50从而找到准确的流程,并向笔记本查询所需信息。
00:09:54同样地,它会检查端点、分析流程,
00:09:56并利用导出的 JSON 思维导图查询笔记本,
00:10:00而非依赖于在代码库中盲目导航。
00:10:03使用 NotebookLM 的另一种方式,
00:10:05是收集 AI 生成网站中常见的各类安全问题,
00:10:08并通过权威来源对其进行知识加固。
00:10:12所以我们让 Claude 通过 CLI 工具创建一个笔记本,
00:10:15并添加功能规格书以及所有相关的安全来源。
00:10:19这个笔记本旨在作为 Claude 的安全手册,
00:10:22以便它在遇到任何疑难杂症时查阅求助。
00:10:26它创建了笔记本并添加了所有来源。
00:10:28其中包括来自 OWASP 的自定义安全指南和速查表、
00:10:32来自 GitHub 的针对我们所用技术栈的安全措施、
00:10:35CVE 数据库,以及确保应用安全性所需的其他资源。
00:10:39它创建的笔记本包含 61 个来源,分布在不同文件中,
00:10:43涵盖了来自多个渠道的安全公告。
00:10:45利用这些资源,当我们让 Claude 进行快速安全检查时,
00:10:49它参考了手册,生成了一份安全报告,
00:10:51并识别出了几个不同严重程度的问题,
00:10:54比如它在应用交易中检测到的浮点误差,
00:10:58这在交易金额较高时可能会非常严重。
00:11:00它之所以能做到这一点,是因为检查是基于 NotebookLM 的研究数据进行的。
00:11:04视频到这里就结束了。
00:11:06如果你想支持本频道并帮我们继续制作此类视频,
00:11:10可以通过下方的“超级感谢”按钮进行赞助。
00:11:13一如既往,感谢观看,我们下期再见。