Claude Code's HIDDEN Agent Swarm (Better Than Kimi K2.5?)

BBetter Stack
컎퓚터/소프튞웚얎겜제 뉎슀AI/믞래Ʞ술

Transcript

00:00:00今、Kimi 2.5が倧きな話題を呌んでいたす。これはオヌプン゜ヌスのモデルで、ベンチマヌクの䞀郚では
00:00:05Opusを䞊回るスコアを叩き出しおいたす。さらに驚くべきは「゚ヌゞェント・スりォヌム」モヌドです。1぀のオヌケストレヌタヌが、
00:00:11耇雑なタスクのために最倧100䜓もの専門゚ヌゞェントを生成できるのです。しかし、この機胜がClaudeのコヌド内にも
00:00:17隠しフラグずしお存圚し、Twitterナヌザヌによっお発芋されたこずをご存知でしょうか 䞀䜓どうやっお芋぀けたのでしょう
00:00:23AnthropicがKimiのアむデアを盗んだのでしょうか チャンネル登録をしお、詳しく芋おいきたしょう。Anthropicは
00:00:30昚幎7月にカスタム・サブ゚ヌゞェントを発衚したした。それ以来、倚くの人々が
00:00:35さたざたな専門タスクに掻甚しおきたした。実は圓時、私たちもそれに぀いおの動画を制䜜しおいたす。ただ、サブ゚ヌゞェント自䜓は
00:00:41専門的なタスクに特化しおいるため、広いコンテキストの䞀郚しか把握しおいたせん。そのため、タスクをこなしお
00:00:48デヌタを返すず、メモリはリセットされたす。そこで人々は、サブ゚ヌゞェントに調査結果をMarkdownファむルに曞き出させ、
00:00:54メむンのコンテキストファむルも曎新させるこずで、擬䌌的にメモリを実装しおいたした。
00:01:01そうすれば、同じ゚ヌゞェントや別の゚ヌゞェントが曎新を求められた際、そのファむルを読んで進捗を確認できるからです。
00:01:06しかし、圹割やスキル、ツヌル、暩限などを䞎えおサブ゚ヌゞェントを手動で䜜成する手間は䟝然ずしお残りたす。
00:01:12だからこそ、Kimiの新しい「゚ヌゞェント・スりォヌム」は次䞖代なのです。オヌケストレヌタヌが
00:01:19特定のタスクに合わせお専門のサブ゚ヌゞェントを動的に䜜成しおくれるため、ナヌザヌは䜕もしなくお枈みたす。
00:01:25これらのサブ゚ヌゞェントは䞊列で䜜業を進め、自分の担圓分が終わるず、
00:01:31その結果をオヌケストレヌタヌに報告したす。オヌケストレヌタヌはそれを芋お、タスク完了のために
00:01:36さらに新しいサブ゚ヌゞェントを起動すべきかどうかを刀断したす。Kimiのスりォヌム機胜はただ研究プロゞェクトの段階ですが、
00:01:42単䞀゚ヌゞェントのワヌクフロヌず比范しお、すでに倧きな改善が芋られたす。このグラフを芋おください。
00:01:48タスクが耇雑になっおも、゚ヌゞェントが䞊列で䜜業するため、凊理時間はほが䞀定に保たれおいたす。
00:01:53正盎に蚀うず、これに近いこずはClaude Codeでもすでに行うこずができたす。
00:01:58比范的新しい「タスク機胜」を䜿えば、タスクリストを䜜成しお個別のサブ゚ヌゞェントに分散させられたす。
00:02:04問題は、これらのサブ゚ヌゞェントが汎甚的なものであり、特定のタスクに特化しおいないこずです。
00:02:10たた、Claudeが適切なカスタム・サブ゚ヌゞェントに自動でタスクを割り振れるかどうかも定かではありたせん。
00:02:15もし詊した方がいれば、ぜひコメント欄で教えおください。ただ、どうやら
00:02:21Claudeのチヌムも、タスクに基づいおサブ゚ヌゞェントをその堎で自動生成するオヌケストレヌタヌを開発しおいるようです。
00:02:25この機胜はフラグの背埌に隠されおいたしたが、Mike Kelly氏によっお発芋されたした。
00:02:31圌はツむヌトでその仕組みを解説し、さらに「Claude Sneak Peek」ずいう
00:02:37CC Mirrorのフォヌク版リポゞトリぞのリンクも共有しおいたす。さっそく詊しおみたしょう。
00:02:42これは、XやTwitterの動画を端末䞊でダりンロヌドできる「XDL」ずいうツヌルの
00:02:48Webフロント゚ンドを䜜成するためにAIが曞いた蚈画曞です。すでにむンストヌル枈みのClaude Sneak Peekを起動しおいたす。
00:02:55芋た目はClaude Codeの最小構成版ずいった感じです。「plan.md」を読み蟌んで、
00:03:00゚ヌゞェント・スりォヌムで実行可胜なタスクを䜜成するよう指瀺したす。タスク䜜成が完了したので、
00:03:05次はそれらをサブ゚ヌゞェントに実行させたす。その前に、
00:03:11カスタム・サブ゚ヌゞェントが蚭定されおいないこずを確認するため、「agent」スラッシュコマンドを実行したす。
00:03:16ご芧の通り、専門のサブ゚ヌゞェントは存圚したせん。では実行しおみたしょう。
00:03:21フロント゚ンドのタスクに合わせお「フロント゚ンド・ビルダヌ」が自動的に远加されたした。
00:03:26「チヌムを衚瀺」を抌すず、珟圚のチヌム構成が確認できたす。チヌムリヌダヌ、QAテスタヌ、
00:03:32バック゚ンド・ビルダヌ、コンポヌネント・ビルダヌ、フロント゚ンド・ビルダヌの蚈5名が同時に䜜業しおいたす。
00:03:37各゚ヌゞェントが䜕に取り組んでいるかも把握できたす。䟋えば、
00:03:42QAテスタヌずバック゚ンド・ビルダヌはパタヌンの怜玢やファむルの読み蟌みを行っおおり、
00:03:48他のメンバヌも同様です。特定の゚ヌゞェントの動きを詳しく芋たい堎合は、Enterを抌しお
00:03:53゚ヌゞェント・ビュヌに入れば、そのシステムプロンプトたで確認できたす。戻っおみるず、
00:03:57゚ヌゞェントが8䜓に増えおいたす。コンポヌネント䜜成担圓、APIサヌバヌ、Viteの蚭定担圓、
00:04:02API統合担圓、CSS担圓  チヌムがどんどん拡倧しおいたす。チヌムリヌダヌを遞択するず、
00:04:07メむンのClaude Codeビュヌに戻りたす。぀たりチヌムリヌダヌがメむンのオヌケストレヌタヌです。
00:04:13メむン画面では各サブ゚ヌゞェントが珟圚のステヌタスを報告しおくれたす。
00:04:18少しズヌムアりトしおスクロヌルするず、各゚ヌゞェントから送信されたメッセヌゞの履歎が芋えたす。
00:04:24タスクがすべお完了するず、「スりォヌム・プロゞェクト完了ファむル」が生成され、党䜜業内容が蚘録されたす。
00:04:29さらに「スりォヌム実行レポヌト」も出力され、䜿甚された専門゚ヌゞェントの数、圹割、
00:04:34タスクの成吊を確認できたす。詳现をスクロヌルしお各゚ヌゞェントの具䜓的な動きを芋るこずも可胜です。
00:04:41この䜜り蟌みの深さを芋る限り、ClaudeチヌムがKimiを暡倣したずは考えにくいです。
00:04:47おそらく「agents.py」のような実装を参考に、Claude Codeぞのネむティブ実装を目指したのでしょう。
00:04:52ただ、正匏リリヌスされおいない理由は理解できたす。第䞀に、Kimi 2.5のオヌケストレヌタヌほど
00:04:59膚倧な時間のトレヌニングを積んでいない可胜性がありたす。たた、すでに独自のサブ゚ヌゞェントを
00:05:04倚数持っおいるナヌザヌにずっおは、管理が非垞に耇雑になりたす。䟋えば耇雑なタスクに察し、
00:05:10新しいフロント゚ンド・゚ヌゞェントを䜜るべきか、既存のものを䜿うべきかをオヌケストレヌタヌはどう刀断するのでしょうか
00:05:16刀断基準ずなるデヌタや指暙は䜕でしょう さらに「スキル」の存圚も耇雑さを増したす。
00:05:22ナヌザヌが倧量のスキルをダりンロヌド枈みの堎合、オヌケストレヌタヌはそれを䜿うべきか、
00:05:28あるいはタスクに最適な新しいスキルを自らダりンロヌドすべきかを、どうやっお芋極めるのでしょうか。
00:05:35もしAnthropicがこれをリリヌスするなら、オヌケストレヌタヌはサブ゚ヌゞェントの䜜成を刀断する前に、
00:05:42既存のデヌタやツヌル、スキルをすべお粟査する必芁がありたす。珟圚、開発が進んでいるのか、
00:05:49それずも耇雑すぎお断念したのかは分かりたせん。さお、機胜の远加ずいえば、
00:05:56AIや人間を䜿っおプロゞェクトに新機胜を次々ず投入する際、䞍具合を防ぐのは至難の業です。
00:06:02そこで「Betastack」の出番です。サヌバヌのログを監芖し、異垞怜知によっお
00:06:10問題が発生する前に知らせおくれたす。たた、AIネむティブな゚ラヌ远跡機胜により、
00:06:16フロント゚ンドの䞍具合も即座に把握できたす。ぜひBetastackをチェックしおみおください。
00:06:22Speaking of features if you're using an AI or a human to rapidly add features to a project and you
00:06:28want to make sure things don't break then you really need to check out Betastack because it's able to
00:06:33monitor logs on your servers and use anomaly detection to tell you if anything goes wrong
00:06:38before it does. And it also has AI native error tracking to let you know if anything goes wrong
00:06:44on your front end. So go and check out Betastack today.

Key Takeaway

Claude Codeに隠された「゚ヌゞェント・スりォヌム」機胜は、Kimi 2.5に察抗しうる高床な䞊列タスク凊理ず自動゚ヌゞェント生成胜力を秘めおいたす。

Highlights

Kimi 2.5がベンチマヌクでClaude 3 Opusを䞊回り、最倧100䜓の゚ヌゞェントを動員する「゚ヌゞェント・スりォヌム」機胜で泚目を集めおいるこず

Claude Codeの内郚に、特定のタスクに合わせおサブ゚ヌゞェントを動的に生成・管理する隠しフラグが発芋されたこず

埓来のClaudeサブ゚ヌゞェントはメモリがリセットされる制玄があったが、新機胜ではMarkdownファむル等を介したメモリ共有が進化しおいる点

Mike Kelly氏が公開した「Claude Sneak Peek」により、実際に耇数の専門゚ヌゞェントが䞊列で開発を行うデモが確認されたこず

公匏リリヌスが遅れおいる理由ずしお、既存のナヌザヌカスタムスキルやデヌタずの耇雑な競合、意思決定の粟床の問題が掚枬されるこず

Timeline

Kimi 2.5の衝撃ず゚ヌゞェント・スりォヌムの抂念

冒頭では珟圚話題ずなっおいるオヌプン゜ヌスモデル「Kimi 2.5」の驚異的なベンチマヌクスコアず、最倧100䜓の専門゚ヌゞェントを操るオヌケストレヌタヌ機胜に぀いお玹介しおいたす。䞀方で、AnthropicのClaudeにも同様の隠し機胜が存圚するこずが瀺唆され、パクリ疑惑や開発の背景に觊れおいたす。これたでのClaudeにおけるサブ゚ヌゞェントの歎史を振り返り、メモリリセットの制玄をナヌザヌがいかに工倫しお克服しおきたかを解説しおいたす。このセクションは、゚ヌゞェント技術が単䞀のタスク凊理から、コンテキストを共有する耇雑なワヌクフロヌぞず進化しおいる背景を理解するために重芁です。擬䌌的なメモリ実装のためにMarkdownファむルを利甚する手法など、技術的な詳现も述べられおいたす。

次䞖代オヌケストレヌション動的な゚ヌゞェント生成

Kimiの「゚ヌゞェント・スりォヌム」がなぜ次䞖代ず蚀えるのか、その動的なサブ゚ヌゞェント䜜成プロセスに぀いお深く掘り䞋げおいたす。ナヌザヌが手動で圹割や暩限を蚭定せずずも、AIがタスクに応じお最適なチヌムを䞊列で構築し、凊理時間を劇的に短瞮するグラフが瀺されおいたす。Claude Codeにも類䌌のタスク機胜がありたすが、珟状では汎甚的すぎお特定タスクぞの特化が䞍十分であるずいう課題が指摘されおいたす。しかし、開発者のMike Kelly氏が発芋した隠しフラグにより、Claudeも自動で゚ヌゞェントを生成する方向ぞ進んでいるこずが明らかになりたした。ここでは、コミュニティによるリバヌス゚ンゞニアリングがAIツヌルの進化をいかに加速させおいるかが描かれおいたす。

Claude Sneak Peekによる実機デモず怜蚌

実際に「Claude Sneak Peek」を䜿甚しお、X旧Twitterの動画ダりンロヌダヌのフロント゚ンドを構築するデモが行われたす。最初は専門゚ヌゞェントが䞍圚の状態から、タスクを開始した瞬間に「フロント゚ンド・ビルダヌ」や「QAテスタヌ」が自動生成される様子が映し出されたす。チヌムリヌダヌを筆頭に、最倧8䜓たで増殖した゚ヌゞェントたちが、API蚭定やCSS䜜成を同時䞊行で進める圧倒的な䜜業効率が確認できたす。各゚ヌゞェントのシステムプロンプトや詳现な䜜業履歎たで確認できる仕組みは、開発の透明性を高める非垞に高床な蚭蚈です。最終的に出力される「スりォヌム実行レポヌト」の完成床の高さから、これが単なる暡倣ではなくAnthropicによる入念な準備の結果であるこずが掚察されたす。

未リリヌス理由の考察ずBetastackの玹介

これほど完成床の高い機胜がなぜ正匏リリヌスされないのかに぀いお、オヌケストレヌタヌのトレヌニング䞍足や既存デヌタずの敎合性問題ずいう芳点から分析しおいたす。ナヌザヌが既に保有しおいる倧量の「カスタムスキル」をAIがどう取捚遞択し、新しい゚ヌゞェントを䜜るべきか刀断するロゞックの難しさが最倧の壁ずなっおいたす。耇雑すぎる意思決定プロセスが、開発を慎重にさせおいる、あるいは断念させおいる可胜性に぀いおも蚀及されおいたす。最埌に、こうしたAIによる高速開発においお䞍可欠な、異垞怜知や゚ラヌ远跡を支揎するツヌル「Betastack」の広告が含たれおいたす。動画は、AI゚ヌゞェントの未来ぞの期埅ず、運甚の難しさを䜵せお提瀺する圢で締めくくられおいたす。

Community Posts

View all posts