AIエージェントだけで構成された会社を運営してみた

BBetter Stack
컴퓨터/소프트웨어창업/스타트업경영/리더십AI/미래기술

Transcript

00:00:003つのAIエージェントに同じリポジトリを与えたら、彼らは会社を立ち上げました。一人は機能を
00:00:06構築し、一人は設計を書き換え、もう一人は全チケットの処理を担当しました。
00:00:12構造がないと、マルチエージェント設定は混乱に陥り、コストが膨れ上がります。
00:00:17これがPaperclipです。これを解決します。コマンド一つで、組織図、チケット、
00:00:22予算、監査ログ、さらには死活監視を備えたAIエージェントの制御プレーンが得られます。
00:00:27GitHubで64,000スターを超えたばかりです。
00:00:30数分で自分たちの「会社」を設立してみましょう。
00:00:33さて、エージェントについて。単一のエージェントは快適です。タスクを与えれば
00:00:44コードを書いてくれます。ですが、2人目、3人目のエージェントが加わると
00:00:51突然、管理業務が発生します。誰がそのタスクを担当するのか?誰が
00:00:57最終目標を覚えているのか?間違った方向に進んだエージェントを誰が止めるのか?
00:01:03それがPaperclipの解決策です。単独のエージェントは有用ですが、調整が困難です。
00:01:08Paperclipは彼らをチーム、あるいは「会社」に変えます。
00:01:13会社の目標を定義し、組織図を作成します。CEO、CTO、
00:01:202人のエンジニア、リサーチエージェントを配置します。そして、チケットや死活監視、
00:01:27予算、承認、追跡可能性を通じて業務を調整します。タスク、担当者、
00:01:33支出額、目標との整合性を確認できます。「雰囲気」に頼らないオーケストレーションです。
00:01:39実際に見てみましょう。ワークフローを高速化するツールに興味があれば、
00:01:43ぜひ登録を。動画を随時配信しています。では、見てください。ターミナルで
00:01:49「npx paperclip-ai onboard」を実行します。これでローカル環境が起動します。
00:01:56すぐにダッシュボードが立ち上がります。Postgresや認証機能も含まれています。
00:02:03このUIから新しい会社を作成できます。名前は
00:02:09「dev tools company」としましょう。目標を設定します。
00:02:14目標は「今週中にURL短縮ツールのMVPを完成させて公開すること」です。
00:02:20CTOエージェントを追加し、アダプター経由で2人のエンジニアを追加します。
00:02:28一人はバックエンド、もう一人はフロントエンドとテストを担当させます。
00:02:34開始する前に予算を設定します。これが非常に重要です。なぜなら、
00:02:39API料金が爆発するのを防ぐためです。目的は「管理された自律性」です。
00:02:46コードが出力される作業ディレクトリのパスも設定します。
00:02:50さあ、開始しましょう。ボードを観察します。エージェントたちが
00:02:57動き始め、CTOが目標をチケットに分解し、エンジニアが作業を開始します。
00:03:05委任、チケット、履歴、ステータス変更、予算カウンターがすべて連携しています。
00:03:10最初の実装タスクは、すでにコードのコミットへと進んでいます。
00:03:15実行には少し時間がかかりますが、複数のエージェントを動かすので
00:03:19当然のことでしょう。スケールさせるならなおさらです。
00:03:24これはもはやチャットボックス内の単一エージェントではなく、私たちが作った
00:03:30小さな会社そのものです。ここで誤解されやすいのですが、
00:03:37一見、PaperclipはCrewAIやAutoGen、LangGraphのような
00:03:43エージェント・フレームワークと同じに見えます。しかし、それとは少し違います。
00:03:49例えば、調査員、計画者、執筆者、校閲者といった単純なワークフローなら
00:03:55既存のツールで十分です。しかし、Paperclipは一段階高いレベルを目指しています。
00:04:01単なる「労働者」ではなく、組織図で彼らを包み込む「会社」として機能し、
00:04:07構築を支援します。こう考えてみてください。
00:04:13エージェントは従業員、ワークフローはチェックリスト、Paperclipはマネージャーです。
00:04:20組織図、チケット管理、予算、監査ログを備えた「マネージャー」なのです。
00:04:25「エージェントはコードを書けるか?」という問いの答えは、イエスです。
00:04:30ですが、より重要なのは「正しいタスクをこなせるか?」「適切な時に止まれるか?」
00:04:36「明確に引き継げるか?」「何が起きているか監視できるか?」という点です。
00:04:43その答えはすべてイエスです。Paperclipは状態管理、死活監視、予算、
00:04:49階層、ログを提供します。テンプレートやダッシュボードも備えており、
00:04:55チャット窓というより、JiraやLinearのようなエージェント用ツールに近いです。
00:05:02一人のエージェントにプロンプトを投げるのではなく、小さな組織を制御するのです。
00:05:07私たちは普段、Claude CodeやCursor、リサーチ用エージェントなど、
00:05:13様々な端末やタブを往復しています。Paperclipはそれらに共通の運用モデルを与えます。
00:05:18これによって私たちのメンタルモデルも変わります。
00:05:24「この機能をビルドして」ではなく、「この会社の目標は
00:05:30この製品をリリースすること。ルール、組織図、予算はこれだ。承認フローは
00:05:35これ。さあ、やってくれ」と言うようになるのです。
00:05:41チケット、履歴、委任といった構造は、マルチエージェントの作業を
00:05:46論理的に理解するのを助けてくれます。誰がその作業を割り当て、
00:05:52なぜそれが存在し、コードのどこに適合するのかを確認できるのです。
00:05:58予算設定ができるのも大きいです。事後にコストを確認するのではなく、
00:06:05Paperclipは実行前のループの一部としてコストを組み込んでいます。
00:06:12セルフホスト可能でオープンソースなのも大きな利点です。
00:06:17ローカルで動かし、検証し、既存のエージェントと連携させることができます。
00:06:22一方で、その強力な構造が煩わしくなることもあります。
00:06:27ルールが不適切だと、エージェントは無意味なチケットを作成し始めます。
00:06:32簡単なURL短縮ツールが欲しいだけなのに、CTOが勝手に別の壮大な計画を立てるかもしれません。
00:06:39トークンの消費も深刻です。予算管理で抑制はできますが、
00:06:45稚拙なプロンプトや曖昧なルール定義まではカバーできません。
00:06:52「skills.md」ファイルが貧弱だと、会社は混乱したスタートアップのようになります。
00:06:59重要なのはそのファイルの質です。また、簡単なスクリプトを書くだけなら
00:07:03完全にオーバースペックです。一つのファイルの要約やバグ修正だけなら
00:07:08これを使う必要はありません。これは、より多くのエージェントを
00:07:13連携させて何かを構築するためのものです。用途は選びますが、試す価値は十分にあります。
00:07:18こうしたツールやヒントがお好きなら、ぜひ登録を。
00:07:23それでは、また次回の動画でお会いしましょう。

Key Takeaway

Paperclipは、組織図、チケット管理、リアルタイム予算監視を導入することで、個別のAIエージェントを制御可能な一つの「会社」として機能させるオーケストレーションツールである。

Highlights

  • PaperclipはGitHubで64,000スターを獲得した、AIエージェントの組織化と管理に特化したオープンソースの制御プレーンである。

  • npx paperclip-ai onboardコマンドを実行するだけで、Postgresデータベースや認証機能を含む管理ダッシュボードが数分で立ち上がる。

  • 組織図に基づきCEOやCTO、エンジニアなどの役割を定義し、各エージェントの行動をチケット、予算、死活監視を通じて制御できる。

  • 予算設定機能により、API料金の爆発的な増加を防ぎながら「管理された自律性」をAIチームに持たせることが可能である。

  • skills.mdファイルの記述精度が低いと、エージェントが無意味なチケットを作成し、組織運営が混乱したスタートアップの状態に陥る。

  • 単一のスクリプト作成やバグ修正にはオーバースペックだが、複数のエージェントを連携させたMVP開発などの複雑なプロジェクトに適している。

Timeline

マルチエージェント設定における管理の限界と解決策

  • 複数のエージェントが同一のリポジトリで作業すると、構造がない限り混乱とコストの増大を招く。
  • 個別のAIエージェントは単発のタスクには有用だが、複数人体制ではタスクの割り当てや目標の維持に管理業務が必要となる。

3つのエージェントに同じリポジトリを与えた実験では、役割分担のないまま機能構築や設計変更が同時に行われ、制御が困難になる。Paperclipはこの管理不足を解消し、組織図や監査ログを備えた制御プレーンを提供することで、エージェントを「チーム」へと変える。

Paperclipによる会社設立の実践ワークフロー

  • 組織の目標を定義し、CTOやフロントエンド・バックエンドエンジニアといった具体的な役職をエージェントに割り当てる。
  • 実行前に予算の上限を設定することで、AIのループによる意図しない支出を防止できる。
  • CTOエージェントが上位目標をチケットに分解し、下位のエージェントが実装とコミットを自動で行う。

「dev tools company」という架空の会社を立ち上げ、URL短縮ツールのMVPを1週間以内に完成させる目標を設定する。ダッシュボード上で作業ディレクトリを指定し、予算カウンターと連携させることで、進捗とコストを同時に可視化できる。これは単なるチャットUIではなく、JiraやLinearに近いエージェント用業務管理ツールとして機能する。

既存フレームワークとの相違点と運用のメリット

  • CrewAIやAutoGenが単純なタスクフローを重視するのに対し、Paperclipは組織構造と管理機能に重点を置く。
  • エージェントは従業員、ワークフローはチェックリスト、Paperclipはマネージャーとしての役割を担う。
  • 実行前のループにコスト確認が組み込まれており、事後ではなくリアルタイムで支出を抑制できる。

単純な調査や執筆のフローであれば既存ツールで十分だが、Paperclipは「正しいタイミングで止まれるか」「明確に引き継げるか」という組織運営の問いに応える。セルフホスト可能なオープンソースであり、既存の多様なAIツールに共通の運用モデルを与えることで、ユーザーのメンタルモデルを「機能開発」から「組織統制」へとシフトさせる。

Paperclipの制約事項と適切な使用シーン

  • 不適切なプロンプトや曖昧なルール定義は、エージェントによる無意味なチケット作成やトークンの過剰消費を招く。
  • 一つのファイルの要約や単純なスクリプト作成には機能が過剰である。
  • システムの成功は、エージェントの能力を定義するskills.mdファイルの質に依存する。

強力な構造は、設定が不十分な場合に煩わしさへと変わるリスクを孕んでいる。簡単なタスクであればCursorやClaude Codeなどの単体ツールの方が効率的だが、複数の役割を連携させて一つの製品を構築する際には、この「管理された自律性」が真価を発揮する。

Community Posts

No posts yet. Be the first to write about this video!

Write about this video