Ich habe eine Firma aus KI-Agenten gegründet

BBetter Stack
Computing/SoftwareSmall Business/StartupsManagementInternet Technology

Transcript

00:00:00Ich habe drei KI-Agenten dasselbe Repo gegeben, und zusammen haben sie eine Firma gegründet. Einer versuchte,
00:00:06das Feature zu bauen, einer schrieb die Architektur um, und einer bearbeitete alle Tickets. Ohne
00:00:12Struktur verwandelt sich jedes Multi-Agenten-Setup langsam in Chaos und treibt die Kosten in die Höhe.
00:00:17Das hier ist Paperclip, und es versucht das zu beheben. Ein Befehl gibt Ihnen eine lokale Kontrollebene für
00:00:22KI-Agenten mit Organigrammen, Tickets, Budgets, Audit-Logs und sogar Heartbeats.
00:00:27Es hat gerade die Marke von 64.000 Sternen auf GitHub überschritten.
00:00:30Lassen Sie uns in wenigen Minuten unsere eigene Firma mit ein paar KI-Agenten aufbauen.
00:00:33Hier ist die Sache mit Agenten. Ein einzelner Agent fühlt sich gut an. Man gibt ihm eine Aufgabe, er schreibt
00:00:44Code. Tolle Arbeit. Dann nimmt man einen zweiten Agenten, vielleicht sogar einen dritten. Und was passiert,
00:00:51ist, dass daraus plötzlich Management-Arbeit wird. Wer ist für die Aufgabe zuständig? Das ist die Frage. Wer
00:00:57behält dabei das Ziel im Auge, und wer stoppt den Agenten, wenn er das Falsche tut?
00:01:03Das ist das Problem, das Paperclip zu lösen versucht. Reine Agenten, die alleine arbeiten, sind nicht ideal. Nützlich,
00:01:08aber schwer zu koordinieren. Paperclip macht aus ihnen ein Team, oder in diesem Fall eine
00:01:13Firma. Wir definieren ein Firmenziel. Wir erstellen ein Organigramm. Vielleicht gibt es einen CEO, einen CTO,
00:01:20zwei Entwickler und einen Forschungs-Agenten. Dann koordiniert Paperclip die Arbeit durch Tickets, Heartbeats,
00:01:27Budgets, Genehmigungen und Rückverfolgbarkeit. Wir sehen die Aufgabe, wer sie zugewiesen hat, wie viel sie
00:01:33tatsächlich gekostet hat und ob sie noch mit dem Endziel verbunden ist. Weniger willkürliche Orchestrierung?
00:01:39Schauen wir uns das live an. Wenn Ihnen Coding-Tools zur Beschleunigung Ihres Workflows gefallen, dann
00:01:43abonnieren Sie uns doch. Wir veröffentlichen ständig Videos. Und jetzt aufgepasst: In einem leeren Terminal
00:01:49führe ich einfach “npx paperclip-ai onboard” aus. Das startet das lokale Setup. Wenige Augenblicke
00:01:56später läuft Paperclip mit dem Dashboard. Ich habe lokale Dienste, Postgres ist dabei
00:02:03und Authentifizierung. Das ist hier die Benutzeroberfläche, in der ich eine neue Firma gründen kann. Ich werde
00:02:09eine neue Firma gründen und sie “Dev-Tools Company” nennen, oder wie auch immer Ihr Projekt heißt. Hierfür
00:02:14werde ich dieses Ziel festlegen. Das Ziel ist einfach: Ich möchte diese Woche ein URL-Shortener-MVP bauen und releasen.
00:02:20Jetzt kann ich einen CTO-Agenten hinzufügen. Dann füge ich zwei Entwickler über Adapter hinzu. Einer dieser
00:02:28Entwickler-Agenten ist für das Backend zuständig. Der andere für das Frontend und die Testabdeckung. Bevor ich
00:02:34auf Start drücke, lege ich das Budget fest. Dieser Teil ist wirklich entscheidend, denn das Ziel ist,
00:02:39dass die Agenten nicht meine API ausreizen, bis die Rechnung explodiert. Nein, das Ziel ist kontrollierte Autonomie. Ich muss auch
00:02:46den Pfad zu meinem Arbeitsverzeichnis festlegen, in dem der Code ausgegeben wird. Das mache ich hier.
00:02:50Jetzt kann ich die Heartbeats aktivieren und starten. Beobachten wir das Board. Die Agenten wachen
00:02:57beim Heartbeat auf. Der CTO unterteilt das Ziel in Tickets. Unsere Entwickler hier nehmen nun die Arbeit auf.
00:03:05Man sieht Delegation, Tickets, Herkunft, Statusänderungen, den Budgetzähler – alles
00:03:10miteinander verknüpft. Und nun bewegt sich die erste Implementierungsaufgabe bereits in Richtung eines Code-Commits.
00:03:15Die Ausführung hat eigentlich ziemlich lange gedauert, aber wenn man all diese Agenten zusammen hat,
00:03:19ergibt das ein wenig Sinn. Dennoch ist es nicht das schnellste, besonders wenn man versucht, das noch weiter
00:03:24zu skalieren. Das ist nicht mehr nur ein einzelner Agent in einem Chatfenster. Das ist jetzt eine kleine Firma,
00:03:30die durch das Erstellen dieser Agenten – CEO, CTO, all diese Entwickler – läuft. Hier werden die Leute
00:03:37oft verwirrt. Auf den ersten Blick klingt Paperclip wie ein weiteres Agent-Framework, ein CrewAI,
00:03:43ein Auto-Gen oder ein Langraph-artiger Workflow. Das ist aber nicht wirklich der Punkt. Diese Tools sind super,
00:03:49wenn man einen Workflow möchte, oder? Zum Beispiel: Erst ein Forscher, dann Planer, dann Schreiber,
00:03:55dann Prüfer. Ja, klar. Das ist natürlich nützlich. Deshalb nutzen wir sie. Aber Paperclip zielt auf
00:04:01eine höhere Ebene ab. Es sind nicht mehr nur die Arbeiter. Es ist das Unternehmen, das diese
00:04:07Arbeiter in diesem Organigramm umgibt, um den Aufbau wirklich zu unterstützen. Denken Sie es sich so:
00:04:13Ein einzelner Agent ist nur ein Angestellter. Ein Workflow ist wie Ihre Checkliste. Paperclip ist der Manager,
00:04:20das Organigramm, das Ticket-Board, das Budgetsystem, das Audit-Log. Das ist Paperclip
00:04:25als Manager. Fragen, die Sie sich jetzt schon stellen: Kann ein Agent Code schreiben? Nun,
00:04:30wir wissen bereits, dass er es kann. Das ist der Zweck dahinter. Er generiert das jetzt. Die schwierigeren Fragen sind:
00:04:36Kann er an der richtigen Aufgabe arbeiten? Kann er aufhören, wenn er es eigentlich sollte? Kann er Arbeit klar übergeben?
00:04:43Kann ich überprüfen, was hier überhaupt passiert? Und die kurze Antwort auf all das ist: Ja, er kann es.
00:04:49Paperclip bietet Status, Heartbeats, Budget, Hierarchie, Logs. Es bietet sogar portable
00:04:55Templates und ein Dashboard, das sich eher wie Jira oder Linear für Agenten anfühlt als ein Chatfenster.
00:05:02Man hört auf, einen Agenten zu prompten, und fängt an, diese Mini-Organisation zu steuern. Viele von uns
00:05:07wechseln wahrscheinlich noch zwischen Terminals und Setups. Ein Terminal für Claude Code, ein Tab für Cursor,
00:05:13ein Agent für die Recherche, ein Skript für GitHub-Issues. Wir springen zwischen all diesen Fenstern hin und her,
00:05:18aber Paperclip gibt all dem ein gemeinsames Betriebsmodell. Das mentale Modell für all das
00:05:24ändert sich für uns grundlegend. Anstatt zu sagen: “Hey, bitte baue dieses Feature”, sagen wir
00:05:30jetzt eher etwas in der Art wie: “Das Ziel dieser Firma ist es, dieses Produkt zu releasen.”
00:05:35“Hier sind die Regeln der Firma. Hier ist das Organigramm und hier das Budget.”
00:05:41“Hier ist festgelegt, was eine Genehmigung braucht. Und jetzt los.”
00:05:46Die Struktur ist wirklich hilfreich, oder? Tickets, Herkunft, Delegation und so weiter. Multi-Agenten-Arbeit
00:05:52lässt sich so leichter nachvollziehen. Statt nur zu sagen: “Der Agent hat was gemacht, bravo.”, kann man
00:05:58genau sehen, wer die Arbeit zugewiesen hat, warum sie existiert und wie sie in unseren Code passt.
00:06:05Budgets festlegen zu können, ist ebenfalls ein riesiger Vorteil. Viele Agent-Tools behandeln Kosten als etwas,
00:06:12das man erst im Nachhinein prüft. Paperclip macht Kosten zum Teil des Kontrollkreises.
00:06:17Wir legen das Budget vor der Ausführung fest. Es ist self-hosted und Open Source – ein weiterer Pluspunkt.
00:06:22Man kann es lokal ausführen, inspizieren, ändern und mit den bereits genutzten Agenten verbinden.
00:06:27Gleichzeitig kann dieselbe Struktur, die Paperclip so mächtig macht, auch ziemlich nervig sein.
00:06:32Wenn die Regeln schlecht sind, erstellen Agenten Tickets über Unsinn. Ich wollte einen einfachen URL-Shortener,
00:06:39aber jetzt hat mein CTO-Agent vielleicht einen ganz anderen Plan entworfen, den ich gar nicht wollte.
00:06:45Nein danke. Token-Verbrauch ist ebenfalls ein Thema. Deshalb haben wir Budgets zur Kontrolle,
00:06:52aber das hilft nicht gegen schlechte Prompts oder vage Regeldefinitionen. Wenn eure Skill-MD-Dateien
00:06:59nichts taugen, verhält sich eure Firma wie ein verwirrtes Startup. Die Skills-MD muss präzise sein.
00:07:03Und ehrlich gesagt: Für ein einfaches Skript ist das kompletter Overkill. Ich wollte es nur testen.
00:07:08Für dieses Projekt hätte ich es nicht gebraucht. Wenn man nur einen Agenten braucht, der eine Datei
00:07:13zusammenfasst oder einen Bug fixt, ist das nicht nötig. Es ist dafür gedacht, Größeres aufzubauen,
00:07:18wenn viele Agenten zusammenarbeiten sollen. Es lohnt sich definitiv, ist aber nicht für alles geeignet.
00:07:23Wenn euch solche Tools und Tipps gefallen, abonniert uns. Wir sehen uns im nächsten Video.

Key Takeaway

Paperclip transformiert isolierte KI-Agenten durch eine Management-Ebene mit Hierarchien und Budgetkontrolle in eine strukturierte Organisation, um komplexe Softwareprojekte wie MVP-Releases ohne manuellen Koordinationsaufwand zu steuern.

Highlights

  • Paperclip hat die Marke von 64.000 Sternen auf GitHub überschritten und bietet eine lokale Kontrollebene für KI-Agenten.

  • Das System nutzt Organigramme, Tickets, Budgets und Audit-Logs, um das Chaos in Multi-Agenten-Setups zu verhindern.

  • Die Installation erfolgt lokal über den Befehl npx paperclip-ai onboard und umfasst Postgres sowie Authentifizierungsdienste.

  • Budgets werden vor der Ausführung festgelegt, um explodierende API-Kosten durch unkontrollierte Agenten-Autonomie zu vermeiden.

  • Heartbeats wecken Agenten in festgelegten Intervallen auf, damit der CTO-Agent Aufgaben in Tickets unterteilen und an Entwickler delegieren kann.

  • Präzise Skill-MD-Dateien sind für die Funktionalität essenziell, da vage Definitionen zu Fehlplanungen und unnötigem Token-Verbrauch führen.

Timeline

Strukturierung von Multi-Agenten-Chaos

  • Unstrukturierte Multi-Agenten-Systeme führen zu Redundanz und steigenden Betriebskosten.
  • Management-Aufgaben wie Zuständigkeitsklärung und Zielüberwachung überfordern Nutzer bei steigender Agenten-Anzahl.
  • Paperclip fungiert als lokale Kontrollebene mit integrierten Organigrammen und Audit-Logs.

Wenn mehrere Agenten ohne Koordination am selben Repository arbeiten, entstehen Konflikte in der Architektur und Aufgabenverteilung. Paperclip löst dieses Problem, indem es Agenten nicht als Einzelkämpfer, sondern als Teil einer Firma betrachtet. Funktionen wie Heartbeats und Tickets ersetzen die rein willkürliche Orchestrierung durch ein geplantes Betriebsmodell.

Setup und Konfiguration einer virtuellen Firma

  • Der Onboarding-Prozess startet lokal über ein Terminal-Kommando und stellt ein Dashboard bereit.
  • Firmenziele wie der Bau eines URL-Shortener-MVPs definieren den Rahmen der Agenten-Arbeit.
  • Agenten erhalten spezifische Rollen wie CTO, Backend-Entwickler oder Frontend-Tester über Adapter.

Nach der Ausführung von npx paperclip-ai onboard stehen lokale Dienste inklusive Postgres zur Verfügung. Innerhalb der Benutzeroberfläche werden Firmenstrukturen angelegt, wobei der Pfad zum Arbeitsverzeichnis und das Budget explizit definiert werden müssen. Diese Konfiguration stellt sicher, dass die Agenten innerhalb eines festen finanziellen und räumlichen Rahmens agieren.

Operative Ausführung durch Delegation und Überwachung

  • Der CTO-Agent dekonstruiert globale Ziele in handfeste Tickets für die Entwickler-Agenten.
  • Statusänderungen und Budgetverbrauch sind im Dashboard in Echtzeit verfolgbar.
  • Die Implementierung erfolgt durch automatisierte Code-Commits basierend auf zugewiesenen Aufgaben.

Sobald die Heartbeats aktiviert sind, nehmen die Agenten ihre Arbeit auf. Das System zeigt die Herkunft jeder Aufgabe und die damit verbundenen Kosten an, was die Rückverfolgbarkeit erhöht. Obwohl die Ausführung bei komplexen Hierarchien Zeit in Anspruch nimmt, bleibt der Prozess durch die Ticket-Struktur für den menschlichen Nutzer transparent.

Unterscheidung zu bestehenden Agent-Frameworks

  • Paperclip ist kein reines Workflow-Tool wie CrewAI oder Langraph, sondern eine Management-Ebene.
  • Das Tool ersetzt das manuelle Prompting einzelner Agenten durch das Steuern einer Organisation.
  • Ein gemeinsames Betriebsmodell bündelt verschiedene Werkzeuge wie Claude Code oder Cursor in einer Struktur.

Während herkömmliche Frameworks lineare Checklisten abarbeiten, übernimmt Paperclip die Rolle des Managers. Es bietet eine Hierarchie und ein Ticket-Board, das an Jira oder Linear erinnert. Das mentale Modell verschiebt sich weg vom Einzelbefehl hin zur Vorgabe von Firmenregeln und Budgets.

Vorteile, Grenzen und Effizienzfaktoren

  • Vordefinierte Budgets machen Kosten zum Teil des aktiven Kontrollkreises statt zur nachträglichen Analyse.
  • Schlechte Regeldefinitionen in Skill-MD-Dateien führen zu Fehlplanungen und Ressourcenverschwendung.
  • Für einfache Skripte oder einzelne Bugfixes stellt das System einen unverhältnismäßigen Overkill dar.

Die Stärke von Paperclip liegt in der Skalierung großer Projekte, erfordert aber präzise Anweisungen. Unklare Prompts führen dazu, dass der CTO-Agent Pläne entwirft, die nicht dem Nutzerwunsch entsprechen. Als Open-Source-Lösung ist es lokal anpassbar, sollte jedoch nur eingesetzt werden, wenn die Komplexität der Zusammenarbeit zwischen mehreren Agenten dies rechtfertigt.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video