循环工程 (Loop Engineering) 是新的炒作热点……而我已经开始讨厌它了

Transcript

00:00:00我昨天在 X 上偶然看到彼得·斯坦伯格(Peter Steinberger)的一篇帖子,
00:00:02当然,他也是 OpenClaw 的创作者,
00:00:06他在帖子里写道:“这是你的每月提醒,
00:00:09你不应该再直接向编码代理发送提示词了。
00:00:12你应该设计循环来向你的代理发送提示词。”
00:00:17天哪,对此我有一些想法。
00:00:21所以现在成了“循环工程”了,对吧?
00:00:23我觉得这还没成为一个官方术语,
00:00:26但我们走着瞧吧。
00:00:27当然,我们是从过去
00:00:29有“提示词工程”的时代走过来的。
00:00:31然后业界的一部分人决定
00:00:33应该将其重述或重新标记
00:00:37为“上下文工程”,这一直很愚蠢,
00:00:39因为归根结底都是一回事,
00:00:41因为它一直都是为了确保
00:00:43模型拥有正确的上下文。
00:00:45这也就是提示词工程背后的全部理念,
00:00:48因为没错,显然正确的上下文很重要,
00:00:51过去很重要,现在很重要,将来也同样重要,
00:00:54因为如果你想有更好的机会
00:00:57从大语言模型中获得好的结果,
00:00:59你需要给它们正确的上下文。
00:01:02这样你才有更好的机会,当然没有保证。
00:01:05即使有了正确的上下文,错误仍有可能发生。
00:01:07我们只是没能得到你想要的东西。
00:01:10这都是完全可能的,因为它依然
00:01:12是一个非确定性的系统,一个非确定性的工具。
00:01:15但如果你想尝试获得好的结果,
00:01:18而且你确实可以得到好的结果,
00:01:20那么提供正确的上下文就很重要。
00:01:23现在,在 2025 年到 2026 年的交替期间,当然,
00:01:28在这一整年里,我们看到了代理编码的兴起,
00:01:32因为像 CloudCode 和 Codex 这样的工具结合了
00:01:36它们内部使用的模型,这些模型经过了深度微调
00:01:39并针对指令遵循和编码任务进行了优化,
00:01:42这些工具和模型向我们展示了,没错,
00:01:45你确实可以使用这些 AI 模型和大语言模型来完成编码任务,
00:01:51并让它们作为助手来完成工作。
00:01:55至少这仍然是我的看法和经验。
00:01:58我已经大量使用这些模型和工具了,
00:02:02几乎每天都在摆弄这些工具,
00:02:05每天都在用,而且不只是随便玩玩,
00:02:07也用它们做严肃的项目。
00:02:10当然,这就是我制作关于 CloudCode 和 Codex 的课程的原因,
00:02:12我在课程中进行了更深入的探讨,
00:02:15并分享了我的学习心得以及如何使用这些工具。
00:02:17这些工具是有用的助手,
00:02:21但它们还不是开发者的替代品。
00:02:25而且正如我在许多其他剧集中分享的那样,
00:02:28在不久的将来可能也不会是。
00:02:31尽管如此,Anthropic 和 OpenAI 当然
00:02:33为这些工具添加了额外的命令,
00:02:36比如 Codex 中的 /goal 命令
00:02:41或者 CloudCode 中的 /loop 命令,
00:02:43其理念是你可以指定一个具体的目标,
00:02:46或者一个可能更复杂的任务,
00:02:51并在其前面加上该命令。
00:02:53然后该工具,Codex 或 CloudCode 配合模型,
00:02:56将会持续运行并不断自我重新提示,
00:03:00直到任务完成。
00:03:03这在某种程度上又回到了 RALF 循环。
00:03:06记得 2026 年初的 RALF 循环吗,
00:03:09那时我们围绕 RALF 循环进行了炒作,
00:03:13有些人向你推销说,你只需要一个详细的、
00:03:16分步任务列表,这些任务需要被完成
00:03:19以实现某个目标、构建某个功能,
00:03:24然后你就可以使用一个扩展,
00:03:27让 CloudCode 和 Codex 在某点之后保持运行,
00:03:28然后一步步完成该列表。
00:03:33尽管我们在一月份就已经有了 RALF 循环,
00:03:34而且有些人把它作为构建软件的自动解决方案卖给你,
00:03:38但那些软件都在哪里呢?
00:03:41那些错误极少、令人惊叹的软件在哪里?
00:03:44为什么 CloudCode 还在不断闪烁?
00:03:46是啊。
00:03:50总之,那时我们有 RALF 循环。
00:03:54现在它回来了,正式集成到了 CloudCode 和 Codex 中。
00:03:55现在我们谈论的是循环工程,
00:03:58或者设计你自己的循环来提示你的代理。
00:04:03当然,对于在 OpenAI 工作的人来说,
00:04:05这很容易说,
00:04:10因为他们有无限的 Token,
00:04:12因为事实证明,这些循环、这些命令,
00:04:17它们可能会消耗大量的 Token。
00:04:20问题就在于整个系统
00:04:23具有同样的概率性本质。
00:04:27我认为常被忽视的一点是,
00:04:33我的经验确实是,
00:04:34这些 AI 模型和/或这些工具,
00:04:38以及两者结合起来,确实都是如此。
00:04:40它们确实很擅长一直运行,
00:04:43直到实现某个目标。
00:04:46我是说,几个月前我有一个小例子,
00:04:50我有一些 PDF 文档
00:04:52需要合并成一个,合并后不能大于 5MB,
00:04:59但每个单独的文档都已经像 6MB 了,
00:05:01因为它们包含扫描件。
00:05:03所以我把我的编码代理,我想是 Codex,扔去处理这个任务,
00:05:06它一直在运行,写了一些小程序之类的,
00:05:08直到它真的实现了目标。
00:05:10显然,这可能不是一个超级复杂的任务。
00:05:14重点仅仅是,确实,这些模型,
00:05:17如果它们能验证结果,它们在实现目标方面表现得相当不错,
00:05:19在实现某个任务方面。
00:05:22它们只是不断尝试,换用不同的方法。
00:05:25问题是,这不一定是构建优秀软件的方式。
00:05:30把事情做完,找到一种方法去做某事,是一回事。
00:05:32它们只会不断尝试,试图通过不同的方法去实现目标。
00:05:36问题在于,这并不一定是构建高质量软件的方式。
00:05:41能够把事情做完,或者找到某种完成任务的方法,这只是一方面。
00:05:48只找一种达到目的的方法并不是一个好的策略,
00:05:51因为那一种方法可能在当下能完成一件事。
00:05:54它将来可能会崩溃。
00:05:57它可能对稍微不同的输入就会失败。
00:06:02它可能包含大量的错误或安全漏洞。
00:06:08它可能会因为许多原因、许多其他情况而失败。
00:06:09它可能有很差的性能。
00:06:11再说一次,如果你只是想现在把这一件事做完,
00:06:15这些可能都不重要。
00:06:20但这不是作为产品的软件的意义所在。
00:06:22所以,开发者们之所以学习
00:06:24某些模式、实践和方法,是因为它们更有意义,
00:06:28因为它们更容易适应、理解和调整。
00:06:31不仅仅是为了整洁,
00:06:35而是为了可扩展性、可维护性、性能、安全,
00:06:41因为某些模式、实践和方法是行之有效的
00:06:45因为它们更易于适配、更易于理解、也更易于调整。
00:06:51因为你认为 AI 只需要去理解它,人类不需要,
00:06:55这其实是一个非常糟糕的观点,
00:07:00因为显然 AI 模型有有限的上下文窗口等等。
00:07:02即使如此,如果这是你对可理解性的看法,
00:07:06其他部分仍然很重要。
00:07:10是的,我想没必要再说这个了。
00:07:14我真的很讨厌现在这个时候,
00:07:17我们不断涌现出所有这些恼人、愚蠢的术语。
00:07:21然后有很多人试图以此来向你推销产品和课程。
00:07:23我自己也卖课程。
00:07:29我只是不会、也不打算向你卖循环工程或类似的东西的课程。
00:07:37但没办法,现实就是这样。
00:07:39我肯定在某个时刻我们会过去这个阶段。
00:07:45我们可以把这些编码代理用在它们真正擅长的地方——作为有用的助手。
00:07:47但现在我们还困在这里。
00:07:52我很期待看到循环工程之后会是什么。
00:07:54我相信在某个时间点,我们终将跨越这一阶段。
00:07:58届时,我们能真正将这些编程代理视为实用的辅助工具。
00:08:03但当下,我们仍受困于此。
00:08:05我很期待看到“循环工程”之后会是什么。

Description

We have a new AI trend: Loop Engineering! Are you still writing prompts? You are so behind... 🤦 Learn something useful: https://academind.com/courses Website: https://maximilian-schwarzmueller.com/ Socials: 👉 Twitch: https://www.twitch.tv/maxedapps 👉 X: https://x.com/maxedapps 👉 Udemy: https://www.udemy.com/user/maximilian-schwarzmuller/ 👉 LinkedIn: https://www.linkedin.com/in/maximilian-schwarzmueller/ Want to become a web developer or expand your web development knowledge? I have multiple bestselling online courses on React, Angular, NodeJS, Docker & much more! 👉 https://academind.com/courses

Community Posts

No posts yet. Be the first to write about this video!

Write about this video