真没想到 Claude 会发布这个功能

AAI LABS
컴퓨터/소프트웨어창업/스타트업경영/리더십AI/미래기술

Transcript

00:00:00究竟是什么让那些能够蓬勃发展的开发者脱颖而出,而让另一些人被时代淘汰。
00:00:04自从 AI 进入主流视野以来,它已经开始为我们自动化处理大量任务,
00:00:08正如我们在上一段视频中看到的,Claude 已经成为了智能体编排者,这彻底改变了我们的工作流程。
00:00:12软件开发者是最早大规模采用 AI 的群体,
00:00:17因为他们的大部分工作涉及重复的代码编写,而这往往效率低下。
00:00:21如今,AI 已成为每位开发者工作流的核心部分,如果你还在用半年前的方式使用 AI,那你已经落伍了。
00:00:26针对这一现状,Anthropic 发布了一篇文章讨论软件开发的趋势。
00:00:31当我们在团队内部讨论时,我们发现这些趋势与我们的工作流深度契合,并引发了强烈共鸣。
00:00:35软件开发生命周期正在发生剧变。
00:00:40得益于 AI,曾经需要数周或数月才能完成的周期,现在只需几小时。
00:00:46传统的开发周期是这样的:
00:00:51数周的规划与设计、实施与测试、评审,然后循环往复。
00:00:56但在 AI 时代,这一切都变了。现在你只需表达意图,智能体就会生成实现方案。
00:01:01人类仍需参与的部分仅剩下“评审”和“表达意图”,
00:01:05其余部分全由 AI 智能体处理。这完全改变了“工程”的定义。
00:01:11软件开发不再意味着编写代码,而是意味着编排编写代码的智能体、提供战略方向并确保系统按预期运行。
00:01:16甚至入职培训的时间也从数周缩短至几小时。
00:01:21AI 可以探索代码库并让新成员立即上手。现在,
00:01:26随着我们的焦点转向指导智能体,每个人都在成为全栈工程师,而不再局限于单一领域的专家。
00:01:30工程师只需具备基础的技术栈知识即可开展工作,AI 会填补他们知识储备的空白。
00:01:35这实现了更紧密的反馈循环和更快的学习速度。
00:01:40数周的跨团队协作现在只需一次工作会议就能搞定。这完全印证了 Linear 首席执行官在其文章中的预测:
00:01:45软件工作流的中间环节已被 AI 取代。
00:01:50如果你仍把时间花在中间阶段,那你就是在逆流而行。
00:01:55这又回到了我们一直强调的原则:你必须在规划阶段保持高效,并清晰地表达你的意图。
00:01:59现在最重要的技能是“清晰度”,即精确描述需求并引导智能体交付最佳产品的能力。
00:02:05在继续之前,Team AI Labs 将参加在卡塔尔多哈举行的 2026 年网络峰会(Web Summit 2026)。
00:02:10如果你正准备参加或就在附近,这是你与我们团队见面、交流并相互学习的好机会。
00:02:16期待在那儿见到你。我们已经从单一智能体进化到了多智能体系统。
00:02:20我们在之前的视频中提到过,Claude Code 现在已经在其产品中实现了多智能体架构。
00:02:26早期的结构是使用单一智能体处理开发,它只有一个上下文窗口,并独立管理所有任务。
00:02:31问题在于单一上下文窗口很快就会变得臃肿,因为其工作内存中的信息过多,导致它失去焦点。
00:02:36现在有了一个编排智能体,它像项目经理一样将任务分配给专家智能体。
00:02:41每个智能体都有自己的上下文窗口,然后整合输出结果以生成最终产物。
00:02:46尽管 Claude 能自动处理智能体的生成和管理,我们也会针对特定任务创建专属智能体。
00:02:51我们使用这些智能体是因为它们是根据我们的偏好定制的,根据任务难度选用不同的 Claude 模型,并包含引导指令。
00:02:56子智能体变得更出色了,因为你现在可以让它们在后台运行,
00:03:00同时处理应用程序的不同方面,从而加速整个进程。
00:03:06长程运行的智能体将变得更加强大。
00:03:10智能体已从构建单一功能进化到能够独立构建完整的系统。
00:03:15这种趋势在 2025 年底开始显现,自 Opus 4.5 和 GPT 5.2 等模型发布以来尤为明显。
00:03:18到 2026 年,智能体将能够在极少人工干预的情况下连续工作数天。
00:03:24以前,智能体只能处理应用程序的一小部分;现在,它们能构建并测试整个应用和系统,
00:03:28并在进入下一个功能前验证系统是否运行正常。
00:03:35我们专门做了一段视频讲解如何让长程运行系统更高效,你可以在频道中查看。
00:03:41有了合适的工具和工作流,智能体能够大规模地规划、迭代并从失败中恢复。
00:03:46这改变了开发的经济模式。在大公司中,软件积累了多年无人问津的技术债。
00:03:50现在,智能体可以主动处理这些积压任务。这也为创业者开辟了道路。
00:03:55以前,主要的困难在于技能差距和时间成本。人们有想法,但缺乏资源去实现。
00:04:00有了自主智能体,初创公司现在可以在几天内构建并部署产品。
00:04:04我们也为自己的任务使用长程运行智能体。我们的长程任务工作流使用包含指令的 Claude.md 文件。
00:04:10我们引导 Claude 在每次实施后进行测试。为了确保功能完善,Claude 需要一种验证其工作的方式。
00:04:15我们在内部使用智能体进行测试,视觉测试则使用 Claude Chrome。
00:04:20一旦通过了智能体视角和视觉验证的测试,我们就会将更改提交到 Git 并附带描述性说明。
00:04:25这很重要,因为智能体有时会修改我们并未要求它们改动的代码和测试。
00:04:31Git 让我们能够轻松回滚。我们总是要求 Claude 记录所做的决策,确保提交记录整洁且随时可以发布。
00:04:36为了最大化利用时间,我们要求 Claude 将任务分解为独立的小单元,并指派智能体并行工作。
00:04:41如果你想要这个 Claude.md 和这些智能体以便在自己的项目中使用,可以在 AI Labs Pro 中找到。
00:04:46对于还不了解的人来说,这是我们最近推出的社区,你可以在那里获得即插即用的模板、提示词、所有命令和技能,
00:04:50直接应用到本视频及以往视频涉及的项目中。
00:04:56如果你觉得我们的内容有价值并想支持本频道,这是最好的方式。链接在描述栏中。
00:05:01人类的监管正在通过智能协作实现规模化扩展。
00:05:06随着智能体变得越来越强大,它们审核输出的速度比我们快得多。
00:05:11面对模型产出的大规模输出,我们无法像智能体那样快速审核,
00:05:16因此我们依靠它们来进行各种评审,如安全漏洞、架构一致性和质量问题。
00:05:21梳理一段不是自己写的代码是很耗神的,现在智能体可以代劳。
00:05:25智能体也学会了请求帮助。它们不再盲目尝试任务,而是知道何时需要人工输入,并作为团队成员提出问题。
00:05:30我们的团队已经在 Claude 身上观察到了这种模式。当我们指出输出效果不佳时,
00:05:35它会询问具体是哪些地方不符合预期,以及它该如何改进。
00:05:40监管的重心正在从“审核一切”转向“审核关键点”。我们只需要评审可能出现问题的例外情况。
00:05:45这也回应了关于 AI 是否会取代开发者的问题。尽管 AI 能力在扩展,人类的核心角色依然稳固。
00:05:50主要的转变在于从编写代码变为评审代码和引导 AI 输出。
00:05:55一位 Anthropic 工程师曾说,使用 AI 的最佳实践是在你清楚正确答案应该是什么样子的时候去使用它。
00:06:00那些知道答案的人,是拥有真实软件工程经验、通过刻苦学习掌握了编程概念的人。
00:06:05那你怎么知道正确答案呢?当你了解针对不同目的该选用哪种方法时就知道了。
00:06:10例如,在测试方面你需要使用特定的方法。我们已经向你展示过如何使用测试驱动开发(TDD)、白盒测试和黑盒测试。
00:06:15我们还介绍了使用 Claude Chrome 扩展和 Puppeteer MCP 等工具进行视觉测试。
00:06:20此外,如果你喜欢我们的内容,请考虑点击“Hype”按钮,这能帮助我们创作更多此类内容并触达更多观众。
00:06:26代理式编码(Agentic coding)正在向我们从未见过的领域和用户群体扩张。
00:06:30在 2025 年初,AI 编码主要对流行框架有效,而对于使用过时语言或冷门框架的系统往往表现挣扎。
00:06:36这就是为什么表现最好的应用通常是基于 React 的,因为模型主要是针对这些框架进行训练的。
00:06:41到 2026 年,代理式编码将扩展到传统开发工具无法触及的语境,
00:06:46包括对 COBOL、FORTRAN 等老旧语言和其他领域特定语言的支持。
00:06:50这将使维护旧系统变得更容易,因为不再需要翻阅那些尘封的旧文档。
00:06:56AI 降低了开发门槛,为网络安全、运维和数据科学等领域的非传统开发者打开了大门。
00:07:01co-work 的发布已经预示了这一方向的进展。写代码的人和不写代码的人之间的界限正随着 AI 的进步而变得模糊。
00:07:06例如,安全团队的成员可以使用 AI 来理解陌生的代码以便发现问题。
00:07:12研究团队一直在使用它为他们的数据构建前端可视化,而非技术员工已经开始在网络连接和数据分析等陌生领域使用 AI。
00:07:17这正是我们团队已经在做的事情。我们的一位成员不熟悉 Golang,但被分配了开发聊天应用后端的任务。
00:07:23他们开启了“规划模式”,通过回答关于应用的问题生成了完整计划。Claude 一次性构建了整个服务器,运行效果完全符合预期。
00:07:28这避免了为了完成单一任务而浪费时间学习一门新语言的麻烦。
00:07:32生产力的提升将重塑软件开发的经济版图。
00:07:38我们已经提到过,由于智能体处理了困难部分,时间线已被极大地压缩。
00:07:44智能体能力、编排改进和人类经验这三个因素相互强化。它们共同压缩了时间线,改变了项目的可行性。
00:07:48曾经被认为难度太大的项目现在变得可行,让产品能够更快投入市场。
00:07:53智能体帮助团队以更少的人力运作。项目周期更短,让我们的投资回报速度更快。
00:07:58过去需要很长时间构建的功能,现在可以在极短的时间内完成。但在继续之前,先听听我们赞助商 Luma AI 的介绍。
00:08:03如果你以前折腾过 AI 视频,你一定知道那种挫败感。那通常感觉像是在玩老虎机。
00:08:08但 Luma AI 的新模型 Ray3Modify 确实改变了游戏规则,它提供了开发者梦寐以求的修改功能。
00:08:13现在你不再是写完提示词后只能听天由命,而是可以拿一段视频进行彻底重绘,
00:08:18更换环境或光影,同时完全保留原有的动作和物理规律。它尊重你的输入数据,
00:08:24而不是生成随机噪声。这种“视频到视频”的技术能保持结构完整性。
00:08:28再加上角色参考功能,你终于可以让主体在不同镜头中保持一致,这在以前几乎是不可能的。
00:08:33这是 AI 视频首次感觉像是一个可控的工具,而不仅仅是个玩具。
00:08:38让小成本制作呈现出大片感。扫描屏幕上的二维码,或点击置顶评论中的链接,今天就在 Dream Machine 中试用 Ray3。
00:08:43整个组织中非技术用例的数量正在大幅增加。
00:08:48销售、市场、法律和运营团队现在可以使用 AI 编码来自动化工作流并构建工具,无需任何工程团队的支持。
00:08:53AI 智能体可以在他们的指导下直接运行并开发系统。
00:08:58拥有领域专长并深谙所面临问题的人,可以利用智能体自主启动解决方案。
00:09:03例如,会计或其他部门的员工比任何人都更了解自己面临的问题。
00:09:08他们可以指导智能体,无需等待开发团队就能获得可行的解决方案。
00:09:12我们的团队已经将 Claude 应用于工作流中。我们使用 Claude code 自动化处理了文档、构思和调研等枯燥的非开发工作,
00:09:17让我们能专注于工作中更有趣、更有创意的部分。
00:09:22代理式编码提升了安全性防御,但也带来了攻击性用途。安全与 AI 是一把双刃剑。
00:09:26能帮你理清代码库和辅助入职的 AI,同样也有能力利用其漏洞。
00:09:33安全知识不再局限于安全工程师。任何工程师都可以担任安全评审员,负责系统的加固和监控。
00:09:37由于安全工程师是领域专家,仍然需要咨询他们的意见。但将 AI 与他们的知识结合,构建、加固和保障应用安全变得更容易。
00:09:42在安全工程师保卫应用的同时,也会出现攻击性用例。去年,我们目睹了一场使用 Claude code 及其工具发起的协同攻击。
00:09:47这意味着代理能力将演变出新型攻击方式,比以往任何时候都更智能、更具杀伤力。
00:09:52保障系统安全将变得至关重要,工程师需要从一开始就关注安全。
00:09:57AI 智能体将在网络防御系统中扮演日益重要的角色,从而实现与攻击速度相匹配的响应。
00:10:01我们需要在攻击发生前做好准备。我们也预见到零日攻击会增加,这使得前瞻性的准备工作更加重要。
00:10:07当我们团队创建应用时,会使用专门的智能体来处理安全问题。这些智能体负责代码审计、测试和服务器端安全(即我们控制访问的层面)。
00:10:12根据应用的不同,可以通过内置技能、可重用的构建命令或外部 MCP 工具等不同组合来确保应用安全。
00:10:18最好使用像 CodeRabbit 这样的外部工具,因为它们专为及早捕捉已知的漏洞模式而设计。
00:10:24本视频到此结束。如果你想支持本频道并帮助我们持续创作此类视频,欢迎加入 AI Labs Pro。
00:10:29一如既往,感谢观看,我们下期再见。
00:10:34in accounting or other departments understands the problems they face better than anyone else.
00:10:39They can instruct agents and have a working solution without waiting for dev team. Our team has already
00:10:44been using Claude in our workflow. We automated the boring non-development work like documentation,
00:10:49ideation and research by using Claude code, letting us focus on the interesting and creative part of
00:10:55our work. Agenda coding improves security defenses and offensive uses. Security and AI are a double
00:11:00edged sword. The same AI that can navigate your code base and help with onboarding is also capable
00:11:06of exploiting its vulnerabilities. Security knowledge is not limited to security engineers.
00:11:10Any engineer can act as a security reviewer, handling hardening and monitoring of systems.
00:11:15Since security engineers are domain specialists, they still need to be consulted. But combining
00:11:20AI with their knowledge, it becomes easier to build, harden and secure applications. While
00:11:25security engineers can defend the applications, there will be offensive use cases too. Last year,
00:11:30we saw a coordinated attack carried out using Claude code and its tools. This means agentic
00:11:35capabilities will evolve the types of attacks we see, making them more intelligent and harmful
00:11:39than ever. Securing systems is going to become increasingly crucial and engineers will need to
00:11:44focus on security from the start. AI agents will play a growing role in cyber defense systems,
00:11:49enabling responses that match the speed of offensive attacks. We need to prepare before
00:11:53attacks happen. We also expect a rise in zero-day attacks, making proactive preparation even more
00:11:58important. When our team creates an app, we use specialized agents for security. These agents
00:12:03handle code review, testing and server-side security, the layer where we control access.
00:12:08Securing applications can be done using different combinations depending on the application,
00:12:12whether it's built-in skills, reusable commands for build purposes or tools from external MCPs.
00:12:18It is better to use an external tool like CodeRabbit because they're built to catch known
00:12:22vulnerability patterns early. That brings us to the end of this video. If you'd like to support
00:12:26the channel and help us keep making videos like this, you can do so by joining AI Labs Pro.
00:12:31As always, thank you for watching and I'll see you in the next one.

Key Takeaway

AI 正在将软件开发从“编写代码”重塑为“编排智能体”,这不仅极大地压缩了开发周期,还模糊了技术与非技术人员之间的界限。

Highlights

软件开发生命周期正在从数周缩短至几小时,人类角色转变为“表达意图”和“最终评审”。

多智能体系统(如 Claude Code)通过编排智能体管理多个专家子智能体,解决了单一上下文臃肿的问题。

长程运行智能体已具备独立构建、测试和修复整个复杂系统及应用的能力。

代理式编码降低了技术门槛,使非技术人员(如销售、法律、运营)能自主开发工具并自动化工作流。

AI 在软件开发中是一把双刃剑,既能自动化防御和安全审计,也可能被用于发起更智能的协同攻击。

开发者成功的核心竞争力正转向“清晰度”,即精确描述需求和引导 AI 交付产品的能力。

Timeline

软件开发范式的根本性转变

视频开篇探讨了 AI 如何彻底改变软件开发生命周期,使原本耗时数周的任务在几小时内完成。传统的规划、设计、实施和测试循环已被“表达意图”和“由智能体执行”所取代。人类工程师的角色正在从代码编写者转变为战略编排者,负责提供方向并确保系统按预期运行。由于 AI 能快速探索代码库,新员工的入职培训时间也大幅缩短。这种转变意味着传统的中间开发环节已被 AI 替代,追求开发效率的重点已发生偏移。

从单一智能体到多智能体系统的进化

主讲人强调了“表达意图的清晰度”已成为当前最重要的开发者技能。随着 Claude Code 等工具的发布,架构已从单一智能体进化为多智能体系统。单一智能体常因上下文窗口过载而失去焦点,而多智能体架构通过一个“编排智能体”将任务分配给多个“专家子智能体”。每个子智能体拥有独立的上下文,能够并行处理应用程序的不同方面。这种模式不仅提高了处理复杂任务的准确性,还显著提升了整体开发速度。

长程运行智能体与开发经济学的变革

本段详细介绍了长程运行智能体的崛起,它们从构建单一功能进化到能够自主构建和验证完整系统。到 2026 年,这些智能体预计可在极少人工干预下连续工作数天,并能从失败中自我修复。这改变了软件开发的经济模式,使大型企业能更高效地处理多年积累的技术债。对于初创公司而言,这意味着即使缺乏深厚的技术背景,也能在几天内从想法变为部署。此外,团队推出的 AI Labs Pro 社区为开发者提供了即插即用的模板和指令集,以最大化这些工具的效能。

人类监管的规模化与关键评审角色

随着智能体产出代码量的爆炸式增长,人类已无法逐行审核,因此监管重点转向了“关键点评审”。智能体现在不仅能自动检测安全漏洞和架构一致性,甚至学会了在遇到不确定性时主动请求人类帮助。尽管 AI 能力在扩张,但具备深厚编程概念背景的资深工程师依然不可或缺,因为他们知道“正确答案”的样貌。视频提到,使用 AI 的最佳实践是在了解不同测试方法(如 TDD、白盒和黑盒测试)的基础上进行引导。人类的角色已稳固在定义质量标准和处理例外情况上。

代理式编码的扩张与旧系统维护

AI 编码能力正在向非主流框架和古老编程语言(如 COBOL 和 FORTRAN)扩张。到 2026 年,AI 将能轻松理解和维护那些由于文档缺失而尘封多年的旧系统,降低了技术债的处理难度。这也为网络安全、运维和数据科学等领域的非传统开发者打开了大门,使他们能跨越语言障碍完成任务。视频举例说明了一位不熟悉 Golang 的成员如何利用 Claude 的“规划模式”一次性构建出运行良好的后端。这种能力的普及使得“写代码”和“不写代码”的人群界限变得模糊。

非技术团队的赋能与 Luma AI 视频工具

AI 正在重塑整个组织的生产力,销售、市场和法律团队现在可以无需工程支持就自主构建工具。拥有领域知识的非技术员工能直接指导智能体解决部门痛点,极大地提高了投资回报率。在中间插播的赞助商环节,介绍了 Luma AI 的 Ray3 视频模型,强调了其“视频到视频”重绘和角色参考功能。这种可控性让 AI 视频生成从“抽奖式”转变为真正的专业生产力工具。最后回归主题,提到 Claude Code 能够自动化处理文档和调研等枯燥工作,释放人类的创造力。

AI 安全性的双刃剑:防御与攻击

视频最后深入探讨了 AI 在安全领域的双重作用,既是加固系统的盾,也可能成为发起零日攻击的矛。2025 年已出现利用 Claude 工具发起的协同攻击,预示着未来的网络威胁将更加智能化和具有破坏性。工程师必须从开发初期就关注安全性,利用专门的审计智能体和外部工具(如 CodeRabbit)进行监控。虽然任何工程师现在都能担任安全评审员,但资深安全专家的领域知识在构建复杂防御体系时依然至关重要。视频总结道,前瞻性的准备和 AI 防御系统的快速响应将是应对未来风险的关键。

Community Posts

View all posts