Hör auf, Claude Code ohne dieses Fable 5 Agentic OS zu verwenden

CChase AI
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00Hey Jarvis, gib mir den Überblick für heute.
00:00:03Guten Morgen.
00:00:04Du stehst bei etwa 466.000 Followern auf allen Plattformen, ein Zuwachs von etwa 3.000 diese Woche.
00:00:12Die neuesten Videos erzielen etwa 4.000 Aufrufe pro Tag, 17.000 bisher.
00:00:18Große KI-Nachricht heute: Die US-Regierung hat Anthropic gezwungen, den öffentlichen Zugang zu seiner Top-Mythos-Klasse auszusetzen.
00:00:27Das Wichtigste heute auf der Agenda: Das Jarvis-HUD-Enthüllungsvideo schneiden und veröffentlichen.
00:00:33Soll ich die tägliche Posteingangsprüfung durchführen oder hast du etwas anderes im Sinn?
00:00:37Also, was genau sehen wir hier?
00:00:39Nun, das ist Jarvis, unser Claude Fable 5 Betriebssystem.
00:00:43Wenn wir von Fable 5 sprechen, meine ich, dass dies mit Fable 5 erstellt wurde, aber man braucht kein Fable 5, um es tatsächlich auszuführen.
00:00:51Tatsächlich läuft vieles von dem, was du hier siehst, komplett lokal und kann im Grunde auf jedem beliebigen Modell laufen.
00:00:58Wenn du meine vorherigen Agentic-OS-Videos gesehen hast, kennst du das Prinzip.
00:01:01Wir haben Claude Code genommen und eine weitere Schicht darübergelegt, die uns Möglichkeiten bietet, die man im Terminal einfach nicht bekommt.
00:01:08Dinge wie visuelle Metriken oder Fähigkeiten, die in Buttons umgewandelt wurden – und das ist kein bloßes Produktivitätstheater.
00:01:15Es ist etwas, das uns einen echten Schub gibt, wenn wir in verschiedenen Bereichen tätig sind, und es lässt sich zudem leicht für Kunden oder Teammitglieder verpacken, die technisch nicht besonders versiert sind.
00:01:26Und Jarvis ist nur die nächste Entwicklungsstufe dieses Agentic-OS-Modells.
00:01:30Das Rückgrat ist nach wie vor die robuste, vollständig anpassbare Claude-Code-Skill-Architektur, die all Ihre täglichen manuellen Arbeitsabläufe und Aufgaben in Fähigkeiten und Automatisierungen verwandelt.
00:01:43Und auf dieser Grundlage bauen wir auf.
00:01:46Im heutigen Video zeige ich Ihnen, wie es funktioniert, wo der wahre Mehrwert liegt und wie Sie so etwas selbst erstellen können.
00:01:53Ich denke, man kann viel aus diesem Projekt mitnehmen, besonders bei der lokalen Sprachmodell-Dynamik, die wir hier haben.
00:01:58Bevor wir eintauchen, ein kurzes Wort von unserem heutigen Sponsor: mir selbst.
00:02:02In Chase AI+ haben Sie nicht nur Zugriff auf mein genaues Setup aus dem heutigen Video, sondern auch auf die Claude Code Masterclass – der beste Weg, um ohne technischen Hintergrund zum KI-Entwickler zu werden.
00:02:14Ich aktualisiere das jede Woche, und es enthält auch eine Codex-Masterclass.
00:02:18Wenn du also am Puls der KI-Entwicklung bleiben willst, ist das der richtige Ort für dich.
00:02:23Wir haben gerade einige Angebote für die Mitgliedschaft, schau also einfach in den angepinnten Kommentar.
00:02:28Lass uns mit einem schnellen Überblick über Jarvis beginnen, damit du verstehst, was du hier eigentlich vor dir hast.
00:02:34Danach schauen wir unter die Haube, wie das funktioniert, damit du weißt, wie du es anpassen und selbst aufbauen kannst.
00:02:41Ganz vorne haben wir die Sprachfunktion, wieder komplett lokal, was sie im Vergleich zu Routings über 11Labs relativ schnell und reaktionsschnell macht.
00:02:53Zu Beginn des Videos hast du Jarvis gehört, wie es mir berichtet hat, was mit meinen neuesten Videos, meinen Follower-Zahlen, KI-Nachrichten usw. los ist.
00:03:01Das ist kein fest einprogrammiertes Skript.
00:03:03Wenn ich Jarvis frage: “Hey, gib mir den Überblick für heute” oder “Was steht heute an?”, prüft es die verschiedenen Berichte, die automatisch in meinem Obsidian-Tresor generiert werden, und bestimmt, was davon wichtig ist.
00:03:18Wie du dich erinnerst, gab es verschiedene Pop-ups, das sind Berichte oder Links zu Dingen, die basierend auf dem Gespräch relevant sind.
00:03:29Es sagte zum Beispiel: “Dein letztes Video läuft so und so”, also gibt es ein “Letzter Upload”-Pop-up, das mich zu diesem Video führt.
00:03:37Es erwähnt Dinge über Anthropic, die im Grunde Fable 5 durch die Regierung gestoppt haben.
00:03:42Was tut es?
00:03:43Es öffnet den Quellenartikel dazu.
00:03:44Es hat auch über KI-Nachrichten und Trends gesprochen, und das alles stammte aus dem Morgenbericht.
00:03:49Wenn ich darauf klicke, siehst du den gesamten Bericht.
00:03:52Dieser Bericht liegt in Obsidian.
00:03:54Dieses gesamte System ist mit Obsidian verknüpft.
00:03:56Ich kann ihn direkt hier lesen oder auf “In Obsidian öffnen” klicken, um den Originalbericht dort aufzurufen.
00:04:04Ich kann auf die verschiedenen Links klicken, alles ist verbunden.
00:04:07Du erinnerst dich vielleicht auch, dass es am Ende gefragt hat: “Soll ich das Posteingangs-Triage für dich übernehmen?”
00:04:12Soll ich in deinen Gmail-Account schauen, was wichtig ist und worauf wir antworten müssen?
00:04:15Nun, das ist ein Skill, und diese Skills und Automatisierungen sind hier rechts dargestellt.
00:04:21Dies ermöglicht es mir, jede Cloud Code-Funktion oder -Automatisierung mit einem Klick zu starten.
00:04:26Und wie gesagt, wenn Sie sich an das erinnern, was wir letzte Woche mit unserem Cloud OS in Obsidian gemacht haben, genau das gleiche Prinzip.
00:04:33Der Mehrwert hier ist eher für den Fall, dass Sie dies mit einem nicht-technischen Team oder nicht-technischen Kunden verwenden,
00:04:39und diese die Funktionen und Automatisierungen mit Cloud Code nutzen möchten, ohne jemals das Terminal öffnen zu müssen.
00:04:44Dies gibt ihnen die ganze Power per Knopfdruck, voll anpassbar.
00:04:49Angenommen, ich wollte eine vollständige Posteingangsübersicht.
00:04:52Wenn ich oben rechts auf “Posteingangsbriefing” klicke, sehe ich sofort, dass es in die Warteschlange gestellt wurde.
00:05:00Wir sehen es hier, und es erscheint ein neues Pop-up für das Briefing mit einem Fortschrittsbalken, der zeigt, dass die Automatisierung arbeitet.
00:05:09Wenn es fertig ist, generiert es nicht nur einen schriftlichen Bericht, sondern gibt mir auch eine mündliche Zusammenfassung.
00:05:16Es gab mir also einen schnellen mündlichen Überblick über die Ergebnisse, und dann kann ich den tatsächlichen Bericht sehen, der wie immer in Obsidian verlinkt ist.
00:05:34Diese Pop-ups sind nützlich, relevant und verlinken auf Dinge, die uns interessieren, und ich kann sie jederzeit löschen.
00:05:39Jetzt schauen wir uns die rechte Seite etwas genauer an.
00:05:41Ich habe schon kurz darüber gesprochen.
00:05:43Wir haben verschiedene Skills, die wir jederzeit austauschen können.
00:05:45Ein Klick genügt, um sie auszuführen.
00:05:47Darunter haben wir den Zeitplan.
00:05:50Das ist mein täglicher Zeitplan, der mit meinem Google Kalender verknüpft ist.
00:05:53Wenn ich darauf klicke, öffnet sich mein Kalender.
00:05:56Wir haben einen kleinen Audio-Bereich.
00:05:58Wenn du aufgepasst hast, als es sprach, konntest du sehen, wie sich die Anzeige auf und ab bewegte, was zeigt, dass es arbeitet.
00:06:05Und darunter haben wir eine Zusammenfassung der KI-Nachrichten.
00:06:10Alles, was du hier siehst, zusammen mit allem, worüber wir gesprochen haben, ist komplett anpassbar.
00:06:15Vielleicht interessiert dich dein Google-Kalender-Zeitplan hier nicht.
00:06:18Vielleicht brauchst du keine Audioanzeige oder einen KI-Nachrichtenüberblick.
00:06:21Das ist in Ordnung.
00:06:22Das Schöne an diesen “Agentic OS”-Systemen ist, dass sie keine Einheitslösung sind.
00:06:29Dies ist nur eine Reihe von Werkzeugen, die ich dir zeige, damit du damit machen kannst, was du willst.
00:06:34Deine Metriken sind anders als meine.
00:06:36Dinge, die du mit einem Klick zur Hand haben möchtest, unterscheiden sich stark von meinen.
00:06:40Es hängt alles von deinem täglichen Arbeitsablauf und dem ab, was du oder dein Unternehmen tut.
00:06:44Der Vorteil dabei ist, wenn wir das für Kunden oder Teammitglieder erstellen, dass man es genau so gestalten kann, wie sie es brauchen.
00:06:51Auf der linken Seite ist es dasselbe.
00:06:53Für meine Vitaldaten zeige ich Dinge wie Abonnentenzahlen oder Status zum neuesten Video.
00:06:58Ich habe einen kleinen Tracker für meine Claude-Token der letzten fünf Stunden.
00:07:01Und einige Dinge wie Direktiven.
00:07:03Direktiven sind wie: “Hier sind die drei wichtigsten Dinge, an denen du heute arbeiten solltest”.
00:07:06Auch das ist völlig dynamisch und Claude Code ermittelt das basierend auf meinem Zeitplan.
00:07:10Dann habe ich noch einen Dokumenten-Trail.
00:07:13Alles, was von Jarvis erstellt oder referenziert wird, erscheint nicht nur als Pop-up.
00:07:18Es ist hier.
00:07:18Wenn ich also darauf klicken will, ist der Morgenbericht direkt da.
00:07:22Das ist die Benutzeroberfläche.
00:07:23Das ist die visuelle Seite von Jarvis.
00:07:25Lass uns nun über die eigentlichen Grundlagen sprechen.
00:07:28Was passiert eigentlich unter der Haube?
00:07:29Denn darauf kommt es letztlich an, seien wir ehrlich.
00:07:32Wenn es nur ein schickes UI wäre, hätten wir es mit Produktivitätstheater zu tun.
00:07:37Wenn dies etwas sein soll, das wirklich etwas bewirkt, statt ständig im Terminal zu sitzen, braucht es ein richtiges Rückgrat.
00:07:43Und genau das schauen wir uns jetzt an.
00:07:45Lass uns durchgehen, was passiert, wenn du Jarvis bittest, etwas zu tun, denn es kann verschiedene Wege einschlagen.
00:07:53Du bist hier und sagst zu Jarvis: “Gib mir ein Update zu meinem heutigen Morgenbriefing”.
00:08:00Du hast eine Automatisierung, die du jeden Morgen ausführst.
00:08:03Sie holt die relevanten Informationen und du willst, dass Jarvis dir davon erzählt.
00:08:07Du willst es nicht lesen.
00:08:07Du willst, dass es entweder ausgeführt wird oder – falls es schon lief – davon erfährst.
00:08:12Du sagst es also hörbar zu Jarvis: “Hey, was steht im heutigen Morgenbericht?”
00:08:18Da du dein Mikrofon benutzt hast, geht das Audio an “Faster Whisper”.
00:08:25Faster Whisper ist ein kostenloses, lokal betriebenes Programm, das deine Sprache transkribiert.
00:08:34Es gibt unzählige lokale Audiotranskribierer.
00:08:39Du kannst diesen durch jeden beliebigen ersetzen.
00:08:40Ich habe diesen gewählt, weil er gut funktioniert.
00:08:42Er hat also deine Stimme in ein Transkript umgewandelt.
00:08:46Was machen wir jetzt damit?
00:08:47Wir haben viel über Fable 5 gesprochen.
00:08:50Muss dann jedes Transkript an Cloud Code gesendet werden, damit wir Fable 5 darauf anwenden und es überprüfen?
00:08:55Nein, natürlich nicht.
00:08:56Das Ganze ist zwar Fable-5-basiert, aber unter der Haube läuft meistens Opus oder Sonnet,
00:09:02oder man könnte für viele dieser Dinge ein lokales Modell nutzen, denn Jarvis muss nicht unbedingt Fable nutzen,
00:09:08auch wenn es geht und sehr gut funktioniert.
00:09:11Es ist nicht so, als würdest du Projekte daraus erstellen.
00:09:13Das ist eher im Bereich persönlicher Assistent oder für ein nicht-technisches Team gedacht,
00:09:17das ähnliche Dinge immer wieder mit einem einfach zu verstehenden UI erledigen will.
00:09:22Also, das ist das große Ganze.
00:09:24Wir haben das Gesprochene in ein Transkript umgewandelt.
00:09:26Jetzt müssen wir wissen, was damit zu tun ist.
00:09:28Dazu haben wir drei Optionen.
00:09:30Die erste Frage ist: Können wir dieses Transkript oder diese Frage mittels regulärer Ausdrücke, Regex, routen?
00:09:39Dieses Skript, ein deterministischer Code – hier ist keine KI im Spiel –
00:09:45schaut sich das Transkript an und prüft: Passt es zu spezifischen, vorprogrammierten Phrasen,
00:09:52bei denen wir wissen, dass sie eine Aktion auslösen sollen?
00:09:55Was bedeutet das?
00:09:56Was habe ich in der Einleitung gesagt?
00:09:58Ich sagte: “Den Überblick für heute”, richtig?
00:10:00Ich benutzte das Wort “Überblick”.
00:10:03Überblick ist ein spezifisches Auslöser-Wort, das Regex erkennt und automatisch eine bestimmte Aktion einleitet.
00:10:11Und diese bestimmte Aktion hast du am Anfang gehört.
00:10:14Berichte prüfen, sagen, was los ist, Überblick für den Tag geben.
00:10:19Eine grundlegende Zusammenfassung – es erkennt das Schlüsselwort und tut das Richtige.
00:10:24Wir mögen das, weil es reiner Code ist, kein Geld kostet, keine KI involviert ist und es sehr, sehr schnell ist.
00:10:32In einer perfekten Welt könnten wir alles so machen, mit sehr schnellen Antworten.
00:10:36Aber das trifft nicht auf alles zu, da das, was man dem KI-System sagt, oft etwas unklar ist.
00:10:43Es braucht etwas Intelligenz, um zu entscheiden, was zu tun ist.
00:10:47Hier kommt Option zwei ins Spiel: Wir bringen Haiku ein.
00:10:51Warum benutzen wir Haiku?
00:10:52Warum das “dümmste” Anthropic-Modell?
00:10:54Weil es billig und schnell ist.
00:10:57Was wir hier tun, ist einfaches Routing.
00:11:01Ich mache nichts, es sei denn, es sind Regex, die ich sofort routen kann.
00:11:06Wir versuchen nur herauszufinden, wohin diese Antwort gehen muss und wer das tun muss.
00:11:11Haiku ist darin sehr gut.
00:11:13Die meisten Dinge, die du von Jarvis verlangst, sind nicht allzu kompliziert.
00:11:18Es muss nur den richtigen Pfad wählen, und Haiku erledigt das für uns.
00:11:22Wir reden hier über Bruchteile eines Cents pro Anfrage.
00:11:26Die dritte Option, die ich in meinem System habe, hängt davon ab, was du tun möchtest: ein komplett lokales Modell.
00:11:34Du musst Haiku überhaupt nicht benutzen.
00:11:35Du kannst ein Modell lokal auf deinem Computer ausführen, was wieder den lokalen Aspekt unterstreicht.
00:11:42Es analysiert das Transkript, um das Routing zu bestimmen.
00:11:45Wir routen nur.
00:11:46Zusammenfassend: Du sprichst, es wird transkribiert, und dann nutzen wir Regex, Haiku oder ein lokales Modell, um zu entscheiden, was zu tun ist.
00:11:54Herausgezoomt: Wir haben Jarvis nun die Anfrage gestellt.
00:11:59Sag mir, was im Morgenbericht steht.
00:12:01Haiku sagt jetzt: “Okay, lass uns einen Blick auf Obsidian werfen”.
00:12:06Gibt es das schon?
00:12:08Wenn der Bericht auf der Festplatte ist, können wir ihn schnell lesen und darauf reagieren.
00:12:16Wenn er nicht in Obsidian existiert, was passiert dann?
00:12:19Es weist Claude Code an, den Morgenbericht zu erstellen.
00:12:24Haiku routet zwar, aber Haiku führt das nicht aus.
00:12:28Wir wollen ein stärkeres Modell.
00:12:30Standardmäßig ist das Opus, aber man könnte es in Sonnet ändern.
00:12:34Und wenn du verrückt bist, könntest du es in Fable 5 ändern, wenn es wieder verfügbar ist.
00:12:38Wenn es noch nicht erstellt wurde, was tun wir?
00:12:42Wir haben eine Headless-Version von Claude Code.
00:12:44Es ist wie Claude Code öffnen, aber es ist unsichtbar.
00:12:47Und es nutzt “dash P”.
00:12:49Hinweis: Die Verwendung von Headless Claude Code mit “dash P” verbraucht in ein paar Tagen nicht dein Abonnement.
00:12:57Okay?
00:12:57Es zieht von den 200 Dollar API-Guthaben, die man jeden Monat bekommt.
00:13:02Kann das ein Problem sein?
00:13:04In großem Maßstab?
00:13:05Ja.
00:13:06Deshalb solltest du vieles davon mit Sonnet tun.
00:13:10Wird das in der Realität ein Problem sein?
00:13:13Ich würde behaupten: eher nicht.
00:13:15Was ist der Zweck von etwas wie Jarvis?
00:13:17Es soll als persönlicher Assistent und Aufgabenmanager fungieren.
00:13:21Wir bauen mit Jarvis kein Facebook.
00:13:24Wenn du das wirklich tätest, wärst du fest im Terminal.
00:13:27Dies ist für persönliche Assistenz oder nicht-technische Teammitglieder.
00:13:31Bei einer gewissen Komplexität würdest du das nicht nutzen.
00:13:33Das ist nicht das richtige Werkzeug dafür.
00:13:35Ist es daher wahrscheinlich, dass du 200 Dollar Guthaben verbrauchst, wenn du meist Sonnet nutzt?
00:13:44Ich würde sagen: nein.
00:13:46Kein großes Problem, aber etwas, worüber man nachdenken sollte.
00:13:48Und noch einmal: Wenn das ein Problem für dich ist, dann benutze einfach nicht Cloud Code dafür.
00:13:52Das hier nennt sich Fable 5 OS, aber seien wir ehrlich.
00:13:55Du könntest das durch Codex ersetzen.
00:13:56Du könntest das Ganze durch lokale Modelle ersetzen.
00:13:59Weißt du, es muss nicht Cloud Code sein.
00:14:02Die Infrastruktur ist anpassbar und kann durch alles ersetzt werden, was du willst.
00:14:07Aber zurück zu unserem Beispiel: Wir sagten, wir wollten den Morgenbericht.
00:14:10Er war nicht in Obsidian, also startet es jetzt eine Headless-Version von Cloud Code, um den Bericht für uns zu erstellen.
00:14:16Dieser Bericht wird dann auf Obsidian hochgeladen, es liest den Bericht und generiert dann eine Antwort mit dieser Zusammenfassung.
00:14:25Diese Zusammenfassung geht an Kokoro.
00:14:29Kokoro ist ein weiteres lokales Open-Source-Modell, das das Zusammenfassungstranskript, das Cloud Code erstellt hat, nimmt und es in Worte fasst, in eine Stimme verwandelt.
00:14:39Denk daran wie an ein Mini-11Labs auf unserem Computer.
00:14:43Dann sagt Kokoro: Hey, im heutigen Morgenbericht, bla, bla, bla, bla, bla, und das geht an dich.
00:14:49Die Stimme, die du heute bei Jarvis gehört hast, stammt von Kokoro.
00:14:53Das könnte durch jede beliebige Stimme ersetzt werden.
00:14:55Also wieder: lokal, anpassbar.
00:14:56Aber so läuft das Ganze ab, wenn du Jarvis bittest, etwas zu tun, und das ist der Weg, den es nimmt.
00:15:04Also, um es noch einmal zusammenzufassen, da ich sicher bin, dass viele von euch sehr verwirrt sind: Was passiert?
00:15:10Du bittest Jarvis, etwas zu tun.
00:15:13Diese Bitte muss in ein Transkript umgewandelt werden.
00:15:16Faster Whisper erledigt das kostenlos.
00:15:18Sobald wir das Transkript haben, müssen wir herausfinden, wie wir das routen.
00:15:22Wir verwenden entweder reguläre Ausdrücke, ein günstiges Haiku-Modell oder ein lokales Modell.
00:15:28Von da an müssen wir normalerweise herausfinden, ob es etwas ist, das bereits in Obsidian existiert, oder ob wir Cloud Code aufrufen müssen, um diesen Bericht, diese Anfrage für uns zu erstellen.
00:15:38Sobald es das generiert, was es generieren muss, wird es entweder einen Bericht in Obsidian erstellen oder vielleicht ist es eine HTML-Seite.
00:15:44So oder so erledigt es seine Aufgabe, sendet die Antwort an Kokoro, das sie in eine Stimme verwandelt, die wir hören können, und das kommt zu uns zurück.
00:15:53Einfach genug.
00:15:54Nun, einen Schritt weiter, alles, was tatsächlich unter der Haube vor sich geht.
00:15:57Wenn wir Morgenbericht sagen, wenn wir sagen, mach Fähigkeit A, B und C, wovon reden wir eigentlich?
00:16:01Nun, wir reden davon.
00:16:03Wir reden von der Fähigkeitsarchitektur, die wirklich das Rückgrat von allem ist.
00:16:08Denn was ist ein Morgenbericht?
00:16:09Nun, das könnte alles bedeuten.
00:16:10Was das ist – das ist eine Fähigkeit, die aus anderen kleinen Fähigkeiten besteht, die mir einen großen Bericht geben, der sagt: Prüfe diese Quellen auf diese Informationen, prüfe diese Social-Media-Seiten, um diese Informationen zu erhalten, usw., usw., usw.
00:16:24Aber, wie ich immer wieder betone, diese Fähigkeitsarchitektur ist nur so stark, wie du sie machst.
00:16:30Und wie machen wir das?
00:16:31Und wenn du meine anderen Videos gesehen hast, kennst du meinen Vortrag darüber.
00:16:34Was du tun musst, ist einen Weg zu finden, deine täglichen Arbeitsabläufe zu nehmen.
00:16:38Wenn ich deine täglichen Arbeitsabläufe sage, was meine ich damit?
00:16:40Ich meine: Was machst du Tag für Tag in deinem Privatleben oder deinem Geschäft?
00:16:43Wie, was sind diese gemeinsamen Aufgaben, die immer und immer wieder wiederholt werden?
00:16:47Hast du, als jemand, der jetzt wahrscheinlich weiß, wie man Cloud Code benutzt, dich tatsächlich mit Cloud Code hingesetzt und gesagt: Hey, hier ist, was ich jeden Tag mache.
00:16:55Können wir all das in einzelne Aufgaben aufbrechen?
00:16:58Und dann, können wir diese Aufgaben in Fähigkeiten verwandeln?
00:17:01Und wenn es Sinn ergibt, verwandle diese Fähigkeiten in Automatisierungen.
00:17:04So baust du eine solche Fähigkeitsarchitektur auf.
00:17:06Und genau hier liegt die ganze Kraft davon.
00:17:08Zum Beispiel, und was du hier siehst, ist viel von dem, was ich in meinen verschiedenen Fähigkeiten mache, so etwas wie Inhaltsrecherche.
00:17:14Wiederum, die meisten von euch erstellen keine Inhalte, also wird es etwas völlig anderes sein.
00:17:17Aber der Punkt bleibt.
00:17:19Also, was mache ich für die Recherche?
00:17:20Nun, offensichtlich muss ich mir Dinge wie YouTube ansehen.
00:17:24Und so habe ich die Suche auf YouTube nach Informationen in etwas namens meine YT-Pipeline-Fähigkeit verwandelt, bei der sie sich YouTube-Videos ansieht, sie an Notebook LM sendet und mir dann Zusammenfassungen gibt.
00:17:35Ich muss in der Lage sein, tiefe Recherchen zu bestimmten Themen durchzuführen, die über YouTube hinausgehen, die sich andere Dinge ansehen, sei es Twitter, das Internet im Allgemeinen usw.
00:17:43Nun, ich habe das in eine völlig maßgeschneiderte Deep-Research-Fähigkeit verwandelt.
00:17:47Ich habe ein ganzes GraphRag-System mit LightRag, das viele Informationen darüber enthält, was ich in der Vergangenheit getan habe.
00:17:52Also, was habe ich getan?
00:17:53Ich habe dieses gesamte Abfragesystem in eine Fähigkeit verwandelt.
00:17:56Und so weiter und so fort.
00:17:58Ich habe das dann über alle verschiedenen Bereiche meines Privat- und Geschäftslebens wiederholt, sei es Inhalte, meine Community, meine Agentur, Vertrieb, usw., usw., usw.
00:18:07Und praktisch gesehen, wie du das machen würdest, ist ganz buchstäblich, du würdest einfach Cloud Code öffnen und ihm einen Bewusstseinsstrom geben und sagen: Hier ist, was ich jeden Tag mache.
00:18:15Und dann würdest du fragen: Hey, können wir das in Fähigkeiten verwandeln?
00:18:17Und innerhalb von Chase Heia Plus und dem Link unten habe ich ein vollständiges Skript, das du in Cloud Code einfügen kannst, und es führt dich durch alles, wenn du es brauchst.
00:18:25Und um das alles oben zusammenzufassen: Wenn wir über diese Fähigkeiten sprechen, wenn du dann Jarvis sagst: Hey, mach Fähigkeit X, Y und Z, und es durch den Transkriptionsprozess und das Routing geht, den Teil, wo wir den kopflosen Cloud Code hochfahren, weißt du, und es das im Hintergrund laufen lässt, um etwas zu tun.
00:18:42Wenn das, was es tut, nur eine einfache Fähigkeit ist, weißt du, dass du ein Ergebnis bekommst, das A: korrekt und B: konsistent ist, weil du den Prozess bereits abgebildet hast.
00:18:53Es bleibt nichts wirklich dem Zufall überlassen.
00:18:55Und jedes Mal, wenn wir in der Lage sind, KI-Systeme zu schaffen, die deterministischer Natur sind, ist das besser.
00:19:02Desto weniger sind wir nur den Problemen von KI im Allgemeinen ausgesetzt, wie: Nun, vielleicht macht es, was ich will, vielleicht nicht, oder?
00:19:08Wenn wir Fähigkeiten schaffen, haben wir bestimmte Dinge kodifiziert.
00:19:11Und wenn man das alles zusammennimmt, hast du Jarvis, weißt du, und du kannst unter der Haube sehen, es ist viel mehr als nur eine schicke Benutzeroberfläche mit einigen Metriken, die schön sind, die einfach nett zu haben sind.
00:19:22Da passiert eine Menge darunter.
00:19:23Und wieder, die wahre Kraft von so etwas, weil es eine Web-App ist, ist die Tatsache, dass wir es bündeln und mit Teammitgliedern teilen und mit Kunden teilen können.
00:19:30Sie müssen dir nur sagen, wenn du derjenige bist, der es für sie erstellt, was sie auf der Anpassungsseite wollen.
00:19:36Und die wahre, wahre Kraft ist die gesamte Fähigkeitsarchitektur und die Tatsache, dass du sie irgendwie durch die Kodifizierung verschiedener Aufgaben führen wirst.
00:19:46Weil sie dann hier sitzen können, oder jeder könnte auf diesem Stuhl sitzen, auf dem ich hier sitze, und so etwa 80, 90% der Kraft von Claude Code auf die Art und Weise bekommen, wie ich es jeden Tag benutze, nämlich diese verschiedenen Fähigkeiten und Automatisierungen.
00:19:56Es ist buchstäblich einen Klick von ihnen entfernt.
00:19:58Das ist es, was du ihnen wirklich gibst.
00:20:00Und dann, wenn sie etwas anderes wollen, weißt du, haben wir das ganze Stimmstück davon.
00:20:03Aber das ist am Ende eine schicke Schicht über all dem.
00:20:07Also das ist das ganze System auf den Punkt gebracht.
00:20:09Ich mag es wirklich, hauptsächlich wegen der Anpassbarkeit und der Tatsache, dass wir viele lokale Dinge hinzufügen können.
00:20:14Also kannst du ziemlich kreativ werden mit dem, was es tun kann und womit es sich verbinden kann.
00:20:18Wiederum, nichts hindert dich daran, mehr externe Quellen für so etwas einzubringen, wie es in so etwas wie einen Slack-Agenten und diese Art von Dingen zu verwandeln.
00:20:26Das ist es, wo ich euch damit zurücklasse, Leute.
00:20:30Wenn ihr wollt, noch einmal, mein genaues Setup in Chase AM+, es gibt einen Link dazu im angepinnten Kommentar.
00:20:36Aber ansonsten, lasst mich wissen, was ihr dachtet, und wir sehen uns.

Key Takeaway

Das Jarvis Agentic OS wandelt manuelle Arbeitsabläufe in eine automatisierte, visuelle Steuerungszentrale um, die Claude Code für technisch nicht versierte Nutzer oder Kunden zugänglich macht.

Highlights

  • Das Jarvis-System kombiniert Claude Code mit einer visuellen Benutzeroberfläche, um Aufgaben per Knopfdruck ohne Terminal-Zugriff auszuführen.

  • Die Sprachverarbeitung erfolgt lokal über das Open-Source-Modell 'Faster Whisper' für Transkription und 'Kokoro' für die Sprachausgabe.

  • Die Routing-Logik entscheidet mittels Regex, dem Anthropic-Modell 'Haiku' oder lokalen Modellen über die notwendige Aktion.

  • Die gesamte Systemarchitektur ist modular aufgebaut und erlaubt den Austausch von Claude Code gegen andere Werkzeuge wie Codex oder rein lokale Modelle.

  • Die 'Fähigkeitsarchitektur' kodifiziert tägliche Arbeitsabläufe in automatisierte Prozesse, um deterministische und konsistente Ergebnisse zu erzielen.

Timeline

Funktionsweise und Mehrwert von Jarvis

  • Jarvis fungiert als Agentic OS, das auf einer robusten Claude-Code-Skill-Architektur basiert.
  • Das System visualisiert Metriken und bietet Schaltflächen für Automatisierungen.
  • Obsidian dient als zentraler Datenspeicher für Berichte und verknüpfte Informationen.

Jarvis automatisiert den Abruf täglicher Daten, wie Follower-Zahlen oder KI-Nachrichten, und stellt diese in einer anpassbaren Benutzeroberfläche dar. Durch die Anbindung an Obsidian können Berichte direkt generiert, gelesen und verwaltet werden. Die Architektur zielt darauf ab, leistungsstarke KI-Funktionen für nicht-technische Nutzer ohne den Einsatz des Terminals bereitzustellen.

Technische Architektur unter der Haube

  • Die Sprachverarbeitung nutzt das kostenlose lokale Tool 'Faster Whisper'.
  • Das Routing der Aufgaben erfolgt über Regex, Haiku oder lokale Modelle.
  • Ein Headless-Modus für Claude Code führt Aufgaben im Hintergrund aus.

Wenn ein Nutzer einen Befehl gibt, transkribiert 'Faster Whisper' die Sprache. Die Routing-Logik bestimmt den Pfad: Reguläre Ausdrücke bearbeiten einfache Befehle schnell und kostenlos, während 'Haiku' für komplexere Routing-Entscheidungen zuständig ist. Nach der Ausführung durch eine Headless-Instanz von Claude Code wandelt das lokale Modell 'Kokoro' die Antwort zurück in eine verständliche Audioausgabe.

Entwicklung einer individuellen Fähigkeitsarchitektur

  • Die Stärke des Systems liegt in der Kodifizierung spezifischer täglicher Arbeitsabläufe.
  • Einzelne Aufgaben werden in modulare Fähigkeiten umgewandelt.
  • Die Architektur ist vollständig anpassbar und erweiterbar durch externe Quellen oder lokale Modelle.

Der Aufbau eines effektiven Systems erfordert die Zerlegung täglicher Aktivitäten in spezifische, wiederholbare Fähigkeiten. Durch die Umwandlung dieser Aufgaben in automatisierte Prozesse entstehen deterministische Abläufe, die nicht vom Zufall abhängen. Nutzer können dieses Setup an ihre eigenen Bedürfnisse anpassen, etwa durch die Integration von Tools wie GraphRag oder spezialisierten Recherche-Pipelines.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video