Claudeの完全なオペレーティングシステムを構築する設計図

AAI LABS
Computing/SoftwareInternet Technology

Transcript

00:00:00中世の王になった自分を想像してみてほしい。王国を運営しなければならないが、本当は
00:00:04何もしないで他人に任せたい。だが問題は、部下たちが手取り足取り教えられないと
00:00:10動けないことだ。今本当に必要なのは、王国を自動で運営してくれるシステムだ。
00:00:15それこそがまさにClaude Codeが成し遂げたことだ。Anthropicがアップデートを
00:00:19重ねる中で、単なるコーディングエージェントから完全なオペレーティングシステムへと進化した。
00:00:25PC上のすべてを調整するOSだ。そして、それを繋ぎ合わせるのが動的ワークフローである。
00:00:30王が王国をエージェントに明け渡す前に、この仕組みがどう動くのかを見ていこう。
00:00:35Anthropicがトークンを浪費する新しい方法をリリースし始めてからというもの、それは
00:00:40彼らがClaude Codeで儲けるための口実かもしれないが、単なるコーディングエージェントを超えた。
00:00:44もはや完全なオペレーティングシステムだ。OSがすべてのタスクの基盤となり、
00:00:50マシン上の作業を調整するように、今やClaude Codeが同じ役割を果たしている。
00:00:55PC上のすべてを制御する。だが動的ワークフローがこのシステムをいかに完成させるかに入る前に、
00:01:00他のコンポーネントについても知る必要がある。コンピュータのOSと
00:01:04Claude CodeのOSの唯一の違いは、Archを使わない限りセットアップに
00:01:08苦労しなくて済むということだ。マイクを動かすために膨大なドライバを
00:01:12インストールして、ボイスプロンプトで「バイブス神」のように振る舞う必要もない。
00:01:17本物のOSと同様に、複数のパーツで構成されている。どれも欠かせない要素だ。
00:01:22OSにおけるカーネルが中心であり、すべての操作を制御する。Claude Codeでいうなら
00:01:28Claude.mdファイルとコンテキストファイルがそれに当たる。
00:01:33以前、エージェントが最高のパフォーマンスを発揮できるようにClaude.mdを構築する方法を
00:01:39解説した動画を上げた。カーネルはエージェントを動かす核だからだ。
00:01:44設定が不適切なら、エージェントはプロジェクトの目的を把握できない。そして他の
00:01:48パーツも崩壊してしまう。結婚して人生が崩壊するのと似ている。次はドライバだ。
00:01:53外部デバイスとやり取りする部分だ。Claude CodeにおけるそれはMCPである。
00:01:58Claudeが外部ツールを必要とするときはいつでも、MCPを通じてツールを呼び出して仕事をする。
00:02:04その次が日常的なプログラムで、Claude Codeではスキルや他のコマンドがそれに当たる。
00:02:09これらには反復的なタスクの構造化された指示が含まれており、必要な時に呼び出せる。
00:02:14どのOSにもタスクを定期実行するスケジューラやcronが必要だ。
00:02:20同様に、Claude Codeは最近ループとルーチンを追加した。これらがcronジョブであり、
00:02:25手作業での監視を不要にする。繰り返しの作業を自動化してくれるので、
00:02:29システムを切ってもタスクは走り続ける。誰も使っていないB2B SaaSアプリケーションを
00:02:34見守り続けられるので、安心して眠れるというわけだ。そして最後は、すべてを繋ぎ合わせて
00:02:40一つの完成したOSにする存在だ。それが動的ワークフローである。Opus 4.8で出荷された新機能だ。
00:02:45Claude Codeが動的ワークフローを持つことはご存知かもしれない。基本的には、
00:02:50長時間実行タスクを簡素化しようというAnthropicのもう一つの試みだ。反復可能な指示として機能し、
00:02:55複数のエージェントを生成してタスクを実行する。では、既存のアーキテクチャとどう違うのか?
00:03:01比較すると、最初で最も単純なのがスキルだ。スキルはガイド付きの反復タスクのための指示である。
00:03:06しかしスキルは一つのエージェントによって生成され、そのエージェントが指示を読み取る。
00:03:11既に知っているタスクをより良く行うようガイドするだけで、長時間実行タスクには役に立たない。
00:03:17一人のエージェントがすべてをこなしているに過ぎない。次はgoalコマンドだ。これは
00:03:22あらかじめ設定された終了目標に向かって繰り返し、完了条件に達するまでエージェントがループする。
00:03:27これも長時間実行タスクを改善するための優れた試みだった。リリース以来、自分たちのワークフローで
00:03:32頻繁に使っている。goalもワークフローも複数のエージェントを調整できるが、異なるものだ。
00:03:38分ける鍵は決定論的かどうかだ。goalは非決定論的で、システムが次に何をすべきか決める。
00:03:43ワークフローは決定論的で、コードが正確に何をすべきかを決定する。ワークフローは
00:03:48キーワード「workflow」を使うだけで生成できる。プロンプトからClaudeが
00:03:54タスクに必要な動的ワークフローを識別する。よく使う単語なので毎回トリガーされると
00:03:59思うかもしれないが、ワークフローを作るという意図がプロンプトに含まれない限りそうはならない。
00:04:04ここがワークフローが異なる点だ。他の人が使うマークダウンとは異なり、JavaScriptを作成する。
00:04:09それは.Claudeフォルダ内のworkflowディレクトリに存在し、
00:04:14スクリプト全体で全てを制御する。計画がコンテキストウィンドウの中にあるのではなく、
00:04:19コードとして書き込まれ、サブエージェントがステップごとにどう動くかを定義する。
00:04:23厳密なスキーマを定義し、サブエージェントが正しい形式で出力するようにする。
00:04:28各エージェントはプロンプトとスキーマを満たすフォームで呼び出される。出力がスキーマと一致するまで
00:04:33作業を続け、完了したら結果を返す。スラッシュコマンドにワークフロー名を付けて実行する。
00:04:39その後、ストレステストしたい計画を渡せばいい。バックグラウンドで走るので、
00:04:44別の作業をしたり別のプロンプトを出して、プロジェクトマネージャーにAI生産性をアピールできる。
00:04:49進捗を確認するには、workflowコマンドを実行するだけだ。ワークフローの全ステージが見られ、
00:04:53各エージェントがどのモデルを呼び出したか、どれだけトークンを消費したかもわかる。
00:04:58実行中にセッションが終わっても心配はいらない。resumeコマンドで続きから再開できる。
00:05:03各ワークフローは独自のIDを持つ。再開するとメモリからエージェントの作業をキャッシュから引き出し、
00:05:08中断した箇所から再開する。うちの祖母と違ってClaude AIの支払いを忘れるようなことはなく、
00:05:14やるべきことをちゃんと覚えている。ワークフローを使う前の注意点が一つ。まだ研究プレビュー版のため、
00:05:19動的ワークフローは通常のClaude Codeセッションよりはるかに多くのトークンを消費する。
00:05:24内部で複数のサブエージェントを動かし、それぞれが独自のコンテキストウィンドウを持つからだ。
00:05:29本当に必要か慎重に検討しないと、200ドルのプランが数時間で空になる。
00:05:35ワークフローがベストな選択肢かを見極める指標がいくつかある。まずは、
00:05:40タスクが独立した単位に分割できるか。もしエージェント同士が作業を待たなければならないなら、
00:05:45並列処理のメリットがなくなるのでワークフローにする意味はない。
00:05:50タスクの依存関係が低いほど、並列化が進んで結果も早くなる。これはスタートアップが、
00:05:55いつまでも親の金に頼って生き残るようなものだ。次は、
00:06:00タスクが単一のコンテキストウィンドウでは収まらず、分割が必要な場合だ。
00:06:05ワークフローはサブエージェントを複数使い、それぞれにコンテキストがある。
00:06:10タスクが大きければそれが必要になる。そうでなければ、時間とトークンの無駄になる。
00:06:15サブエージェントはそれぞれ新鮮なコンテキストで走り、結果だけを返す。
00:06:21推論の内容はコードファイルに残り、必要でない限りメインのコンテキストには入らない。
00:06:26次は、タスクに検証の価値があるかどうか。間違った回答がコストになるような、
00:06:31セキュリティの発見、バグ請求、移行など、前に進む前にクロス検証が必要な場合はワークフローだ。
00:06:36ただし検証には追加のエージェントが必要になり、トークンと時間を食う。
00:06:41AIテックCEOが言ったからとトークンを無駄遣いせず、タスクに価値があるか確認しよう。
00:06:46最後はタスクが決定論的かどうか。ワークフローはコードで構造化されている。
00:06:52実行時に次に何をすべきかエージェントが判断する必要があるなら、ワークフローは向かない。
00:06:57workflowとgoalを選ぶときはタスクの形状を考えよう。タスクには広さと深さがある。
00:07:03広いとは同時に実行できるサブタスクに分割できることだ。深いとは一つずつ進むことだ。
00:07:09ワークフローは「広い」ので、深く潜るよりエージェントを呼んで繰り返し実行する。
00:07:14深いタスクには、goalコマンドで一つずつタスクをこなす方が良い。
00:07:20タスクに合っていると確信した時だけワークフローを使おう。
00:07:25Claude CodeにはDeep Researchという内蔵の動的ワークフローがある。
00:07:32以前は手動で構築していた研究パイプラインが、今やプロジェクトから呼ぶだけでいい。
00:07:37これにより信頼性の高い情報源を確保できるので、母さんがFacebookのグループから拾ってきた
00:07:43デマに騙されずに済む。5つのパーツで構成されている。
00:07:48Claude Codeには「Deep Research(深層リサーチ)」という動的ワークフローが標準で組み込まれています。
00:07:53そして合成というプロセスだ。ワークフローコマンドから作業を見守れる。
00:07:58ツールは親から継承される。トークン消費は激しいので、すぐ上限に達することもある。
00:08:04小さなトピックで100万トークン使うこともある。研究用以外でも独自のワークフローを
00:08:09構築できる。競合調査などだ。プロダクトビルダーには重要だ。
00:08:14より良い製品を作るために競合がどう動いているか知る必要がある。
00:08:194つのフェーズで構成され、完了するとMarkdownレポートを吐き出す。
00:08:24我々の実行では679,000トークンと34エージェントを使った。
00:08:29さらに自己改善も行う。問題が発生すれば修正を適用し、次は同じ失敗をしない。
00:08:34比較指標付きのレポートができるので、ローンチ前の市場分析ソースとして使える。
00:08:39コンテンツが気に入ったら、ハイプボタンを押してサポートしてほしい。
00:08:45OSにはカーネルとドライバが必要だ。その一例が「セカンドブレイン」だ。
00:08:49デバイスをLLMで強化して以来、脳を使わなくなって腐ったような人に最適だ。
00:08:54システムをナビゲートするためのClaude.mdがカーネルになる。
00:08:59日々のプログラムはスキルだ。長セッションで頻繁に行う作業はスキル化しよう。
00:09:04今回の実行では67万9000トークンと34のエージェントを使用し、調査結果を網羅した詳細なMarkdownレポートを作成しました。
00:09:11GoogleカレンダーやNotionのMCPで外部連携もしている。
00:09:17これでカレンダーとNotionを同期し、忙しいスケジュールに草を触る時間も作れる。
00:09:21Claude.mdにフォーマットを記載し、ワークフローで並列化する。
00:09:26朝のブリーフィングワークフローは、複数のソースから情報を集めて朝の準備を整える。
00:09:30プロンプトを投げるだけで、正しいスキルとコンテキストを読み込み、連携してくれる。
00:09:35セカンドブレインには監査ワークフローを作ろう。リンク切れや問題を報告してくれる。
00:09:41修正を走らせて万全の状態を保つ。まあ、君の性格なら来週にはセラピー代を払う羽目になるだろう。
00:09:45これはコーディングプロジェクトでも同じだ。Claude.mdをカーネルにする。
00:09:50プロジェクト用のエージェントを設定し、エディット後のフォーマットなどのフックを設定する。
00:09:55君の恋愛関係やコードの惨状をよそに、少なくとも一つは整理整頓されているべきだ。
00:10:01新しいエンドポイントを追加するスキルを作る。これでコードの一貫性が保てる。
00:10:06リリース前のレビューやデータベース移行用のワークフローで、自動でテストを行う。
00:10:11深夜2時のマネージャーからの電話に怯えることもない。docsフォルダとコードがOSの文脈になる。
00:10:16ワークフローは移行に非常に役立つ。あるライブラリを他へ変換するワークフローを組む。
00:10:21手動で1時間かかっていたものが21分で終わった。
00:10:25節約した時間は、Darioの不適切なディープフェイクを眺めるような大事なことに使える。
00:10:29OSがコーディングに拡張される仕組みだ。すべてを手動でやる必要はない。
00:10:35AI B2B SaaSを立ち上げたいならAI Labs Proへ来い。
00:10:41動画で使ったワークフローやリソース、ガイドが手に入る。
00:10:46同じ志を持つオタクたちや私たちのチームと交流できる。リンクは概要欄だ。
00:10:51動画は以上だ。チャンネルをサポートして動画制作を助けたいなら
00:10:57下の「スーパーサンクス」ボタンを使ってほしい。いつも見てくれてありがとう。
00:11:02また次の動画で会おう。
00:11:07中世の王になった自分を想像してみてほしい。王国を運営しなければならないが、本当は
00:11:12何もしないで他人に任せたい。だが問題は、部下たちが手取り足取り教えられないと
00:11:17動けないことだ。今本当に必要なのは、王国を自動で運営してくれるシステムだ。
00:11:22それこそがまさにClaude Codeが成し遂げたことだ。Anthropicがアップデートを
00:11:27重ねる中で、単なるコーディングエージェントから完全なオペレーティングシステムへと進化した。
00:11:32PC上のすべてを調整するOSだ。そして、それを繋ぎ合わせるのが動的ワークフローである。
00:11:37王が王国をエージェントに明け渡す前に、この仕組みがどう動くのかを見ていこう。
00:11:42Anthropicがトークンを浪費する新しい方法をリリースし始めてからというもの、それは
00:11:46彼らがClaude Codeで儲けるための口実かもしれないが、単なるコーディングエージェントを超えた。
00:11:51もはや完全なオペレーティングシステムだ。OSがすべてのタスクの基盤となり、
00:11:56マシン上の作業を調整するように、今やClaude Codeが同じ役割を果たしている。
00:12:01PC上のすべてを制御する。だが動的ワークフローがこのシステムをいかに完成させるかに入る前に、
00:12:07他のコンポーネントについても知る必要がある。コンピュータのOSと
00:12:12Claude CodeのOSの唯一の違いは、Archを使わない限りセットアップに
00:12:17苦労しなくて済むということだ。マイクを動かすために膨大なドライバを
00:12:22インストールして、ボイスプロンプトで「バイブス神」のように振る舞う必要もない。
00:12:27本物のOSと同様に、複数のパーツで構成されている。どれも欠かせない要素だ。
00:12:32OSにおけるカーネルが中心であり、すべての操作を制御する。Claude Codeでいうなら
00:12:37Claude.mdファイルとコンテキストファイルがそれに当たる。
00:12:43以前、エージェントが最高のパフォーマンスを発揮できるようにClaude.mdを構築する方法を
00:12:47もしAIを活用した次世代のB2B SaaS企業を立ち上げたいけれど、何から始めればいいか分からないなら、ぜひ「AI Labs Pro」に参加してください。
00:12:53設定が不適切なら、エージェントはプロジェクトの目的を把握できない。そして他の
00:12:57パーツも崩壊してしまう。結婚して人生が崩壊するのと似ている。次はドライバだ。
00:13:01外部デバイスとやり取りする部分だ。Claude CodeにおけるそれはMCPである。
00:13:05Claudeが外部ツールを必要とするときはいつでも、MCPを通じてツールを呼び出して仕事をする。
00:13:09その次が日常的なプログラムで、Claude Codeではスキルや他のコマンドがそれに当たる。
00:13:14これらには反復的なタスクの構造化された指示が含まれており、必要な時に呼び出せる。

Description

Claude Code workflow just turned Claude Code into a full operating system that runs your entire project for you. This Claude Code tutorial breaks down dynamic workflows, the new feature shipped with Opus 4.8, plus Claude Code tips Boris Cherny would approve of, so you can hand off long-running work and stop babysitting your agent. Community with All Resources: http://ailabspro.io The Roundup: Our daily newsletter covering the AI stories. Join now: https://www.theroundup.so/ What we cover in this video: The Claude Code Operating System - How Claude Code became a full OS, not just a coding agent - claude.md as the kernel that drives your whole setup - MCP as the drivers that connect external tools - Skills and commands as the everyday programs for repeatable tasks - Loops and routines as the scheduler that runs work on its own Dynamic Workflows (the /workflow feature) - What dynamic workflows are and how the claude code workflow system actually works - Why workflows are deterministic and the goal command is not - How a claude code agentic workflow spawns multiple sub-agents in parallel - Why it writes a JavaScript script in the .claude folder instead of plain markdown - Strict schemas so each agent returns structured, accurate output - Running workflows in the background and resuming them with the workflow ID - A claude code github workflow style setup for reviewing changes before you ship When To Use Workflows vs Goal - How to tell wide tasks from deep tasks - Splitting work into independent units for real parallelism - When a task is big enough to need separate context windows - When a result is worth cross-verifying (security findings, bugs, migrations) - Token cost reality on the $200 plan, so you don't burn your limit Deep Research and Multi-Agent Systems - The built-in Deep Research workflow and its five phases - A competitor research workflow using 34 sub-agents - How a multi-agent setup keeps reasoning out of your main context window Building a Second Brain - claude.md as the kernel of your second brain - Skills, vault memory, Google Calendar and Notion MCPs - A morning brief workflow and an audit workflow to keep it healthy Code Use Cases - Hooks, agents, and skills for real coding projects - A migration workflow that cut an hour of work down to 21 minutes Whether you are looking for how to use Claude Code, want claude code tips for beginners, or a claude code full course style breakdown, this video gives you the agentic workflow patterns to make AI build and run things for you. New to the tool? This works as a claude code for beginners starting point, and you can pair it with the free tier if you want to try Claude Code for free before going deeper. More for builders: - How to use Claude Code for free on the free tier before upgrading - claude code skills you can reuse across every project - Treat this as a mini claude code course you can revisit as the tooling evolves #ai #claudeCode #claudeAi #vibeCoding #claudeCodeTutorial #howToUseClaudeCode #claudeAiTutorial #claudeCodeForBeginners

Community Posts

No posts yet. Be the first to write about this video!

Write about this video