Ranking aller KI-Tools, die ich 2026 genutzt habe (Was TATSÄCHLICH gut ist)

Deutschالعربية English Español Français हिन्दी Bahasa Indonesia 日本語 한국어 Português Русский 中文

Computing/SoftwareSmall Business/StartupsManagementInternet Technology

Transcript

00:00:00Es gibt im Jahr 2026 viel zu viele KI-Tools, und es ist unmöglich geworden, herauszufinden,

00:00:05welche davon tatsächlich ihre Zeit und ihr Geld wert sind. Und weil ich nichts Besseres zu tun habe,

00:00:10habe ich in den letzten Monaten eine ganze Menge davon getestet. Und heute werde ich sie alle

00:00:15bewerten. Ich werde alles behandeln, von einfachen Chatbots bis hin zu vollwertigen Coding-Agenten und

00:00:20alles dazwischen. Am Ende dieses Videos wissen Sie also, auf welche Sie sich tatsächlich konzentrieren sollten.

00:00:27Wir bewerten das Ganze im Standard-Tier-List-Format. S-Tier ist das Beste,

00:00:32D-Tier ist das Schlechteste, und alle diese Tools werden nach ihrer Funktion gruppiert.

00:00:36Wenn es nun darum geht, das spezifische Tool zu bewerten, betrachten wir es durch zwei Linsen. Erstens: Wie

00:00:42schneidet es im Vergleich zu anderen Tools seiner Klasse ab? Wie schneidet also N8N im Vergleich zu anderen No-Code-Automatisierungstools

00:00:49wie Make oder Zapier ab? Aber wir betrachten es auch auf Makro-Ebene, denn man kann

00:00:56der Klassenbeste in etwas wie No-Code-Automatisierung sein. Aber bedeutet das automatisch S-Tier,

00:01:00nur weil man jeden in seiner Kategorie schlägt? Nicht unbedingt, denn das hängt alles irgendwie

00:01:05zusammen. Diese Tools spielen ineinander. Was vor sechs Monaten großartig war, könnte heute

00:01:11Probleme haben. Wenn ich also Ihre Lieblingstools als D-Tier einstufe, hinterlassen Sie unbedingt einen Kommentar und lassen Sie mich wissen,

00:01:14wie sehr Sie meine subjektiven und sehr vagen Bewertungskriterien hassen. Das werde ich beim nächsten Mal

00:01:20im Hinterkopf behalten. Fangen wir also mit den Chatbots an. Und der erste, den wir bewerten werden, ist ChatGPT. Nun,

00:01:26hier haben viele von uns angefangen. Und den Zahlen nach zu urteilen, sind die meisten Leute immer noch hier.

00:01:31Auf Makro-Ebene steigt ChatGPT für mich definitiv im Ranking, weil ihre Modelle

00:01:35so solide sind. 5.4 ist ein großartiges Modell. Wenn wir jedoch über den Chatbot selbst sprechen,

00:01:40komme ich zu dem Schluss: meh, es ist in Ordnung. Es ist zum ultimativen Durchschnitts-Chatbot geworden.

00:01:47Sie werden die Ausgaben nicht hassen. Sie werden die Ausgaben nicht lieben. Und leider,

00:01:51wenn Sie schlecht im Prompting sind, erhalten Sie sehr generische Antworten. Wir alle wissen inzwischen, wie wir

00:01:56ChatGPT-Texte erkennen. Aber für 20 Dollar im Monat bekomme ich eine Menge davon. Und es hat ein paar

00:02:00Extras wie Bildgenerierung. Und das neue Bildgenerierungsmodell ist tatsächlich wirklich gut.

00:02:04Und wo wir gerade von Bildgenerierung sprechen, lassen Sie uns über einen anderen Chatbot sprechen. Und das ist Gemini. Nun, Gemini,

00:02:10das sage ich Ihnen gleich vorweg: A-Tier. Ich denke, wenn Sie nur der Typ Mensch sind,

00:02:15der 20 Dollar im Monat für einen KI-Chatbot ausgibt und einfach nur einen täglichen Begleiter will, ist Gemini bei weitem die beste Wahl.

00:02:21Es ist in dieser Hinsicht besser als Claude. Und was meine ich damit? Sie werden genug

00:02:25Nutzen daraus ziehen, wie der Durchschnittsmensch. Darüber hinaus bietet mir Gemini Bildgenerierung

00:02:31und Nano Banana Pro, das Beste seiner Klasse. Ich kann Videogenerierung bekommen. Und wichtig: Was es besser

00:02:36macht als jedes andere Chat-Modell, ist das Verarbeiten von Videos selbst. Ich kann Gemini YouTube-Videos geben. Ich kann ihm

00:02:42Kurzvideos, Reels, TikToks, was auch immer geben, und es kann sie tatsächlich analysieren. Die anderen

00:02:46haben in diesem Bereich wirklich Probleme oder können es gar nicht. Nun, halte ich 3.1 im Vakuum

00:02:50für besser als 5.4 oder Opus, über das wir gleich sprechen werden? Nein. Aber ich denke, ganzheitlich betrachtet, für 20 Dollar

00:02:55im Monat, als täglicher Begleiter, sollten Sie Gemini verwenden. Und hier kommt Anthropic. Wo ordnen wir also Claude ein?

00:03:00Das ist schwierig, denn wenn wir über Claude und Opus 4.7 sprechen, Opus 4.7 ist das beste Modell in

00:03:08diesem Spiel gerade, zumindest meiner Meinung nach. Und ich denke, Anthropic ist der beste der

00:03:12drei großen Akteure. Wenn wir jedoch rein vom Chatbot sprechen und Sie einen 20-Dollar-Monatsplan

00:03:18haben, könnte man argumentieren, dass es C-Tier ist. Rein, rein basierend auf den Nutzungsproblemen. Wenn Sie in einem 20-Dollar-Monatsplan

00:03:26sind und versuchen, Opus für echte Projekte zu verwenden oder es tatsächlich dazu bringen wollen, irgendetwas

00:03:31zu generieren, werden Sie so schnell gegen eine Wand laufen und sich fragen: Was tue ich hier?

00:03:35Denn für 20 Dollar im Monat bekomme ich wahrscheinlich eine Ausgabe, die eine 95%-Lösung ist, und ich kann

00:03:41das eine Million Mal tun. Während Anthropic Ihre Nutzung ziemlich stark drosselt, wenn Sie

00:03:45nicht einen 100- oder 200-Dollar-Monatsplan haben. Wenn es außerdem um Sachen wie Sauna und Opus geht,

00:03:50kann es nur Text und Code und diese Artefakte. Ich kann keine Bilder machen. Ich kann kein Video machen. Es ist nur Text.

00:03:58Wenn Sie also der durchschnittliche KI-Nutzer sind, der nur einen Chatbot verwendet, würde ich argumentieren, dass es C-Tier ist.

00:04:05Wenn Sie jedoch einen 100-Dollar- oder 200-Dollar-Monatsplan haben, S-Tier. Es sei denn, Sie versuchen,

00:04:14Dinge mit Videos oder Bildern zu machen. Wenn es also um Claude geht, ist es sehr anwendungsfallabhängig und sehr

00:04:20nutzungsabhängig. Also für den durchschnittlichen Typ, der von der Straße kommt, einfach nur wissen will, für welche KI er

00:04:2520 Dollar im Monat zahlen sollte: C-Tier. Aber wenn Sie es ernst meinen, Sie haben einen 100-Dollar- oder 200-Dollar-Monatsplan: S-Tier.

00:04:31Und dann war da noch Grok. Wo ordnen wir Grok ein? Nun, es ist schlechter als alle diese bei Coding-Aufgaben.

00:04:37Es hat ein viel schlechteres Bildmodell als ChatGPT oder Gemini. Sein Videomodell ist schlechter als das von Gemini

00:04:44und eigentlich hat es nur den Vorteil, dass es weniger Leitplanken hat und es ist ziemlich gut, was das

00:04:50Herausfinden angeht, was in der realen Welt in diesem Moment gerade passiert.

00:04:55Es ist also großartig, wenn Sie Twitter-affin sind, vielleicht, wenn Sie Twitter-affin sind, ist es B-Plus-Tier. Für

00:05:00Ihren Durchschnittsnutzer: C-Tier. Um ehrlich zu sein. Und wenn wir darüber sprechen, oh, es ist großartig darin,

00:05:06Videos zu verarbeiten, wie, ich kann es mit einem Twitter-Ding füttern, es weiß, was los ist. Wiederum, wenn Sie

00:05:10hyper-fokussiert auf Twitter-Funktionalität sind, klar. Vielleicht A-Tier. Durchschnittsnutzer: Bestenfalls C-Tier. Sie würden

00:05:17das niemals jemandem empfehlen, der nicht vier Stunden am Tag auf Twitter verbringt. Bevor wir nun

00:05:21zu den Coding-Agent-Rankings springen, möchte ich nur kurz Werbung für meine Claude-Code-Masterclass machen.

00:05:26Sie ist erst letzten Monat herausgekommen und ist der beste Weg, um von Null zum KI-Entwickler zu werden, besonders wenn

00:05:31Sie keinen technischen Hintergrund haben. Ich aktualisiere das jede Woche und in letzter Zeit haben wir uns wirklich

00:05:35darauf konzentriert, wie man ein agentisches Betriebssystem aufbaut, das von Claude Code angetrieben wird und Dinge wie

00:05:42Obsidian für das Gedächtnis einbindet und GWS, um es mit Dingen wie Ihrer Google-Suite zu verbinden. Wenn Sie also daran interessiert sind,

00:05:48können Sie es innerhalb von Chase AI Plus finden, es gibt einen Link im angepinnten Kommentar. Das war's also für

00:05:52die Chatbots. Lassen Sie uns jetzt zu den Coding-Agenten oder diesen Coding-Harnesses wie Codex und

00:05:57Claude Code übergehen. Und wo wir gerade von Claude Code sprechen, das wird das erste sein, über das wir jetzt sprechen. Claude Code: S-Tier für mich.

00:06:03Jedoch dieselbe Art von Unterhaltung wie zuvor. Wovon sprechen wir in Bezug auf

00:06:10die Nutzung? Wenn Sie denken, Sie können mit einem 20-Dollar-Monatsplan zu Claude Code kommen und etwas daraus

00:06:15herausholen, irren Sie sich. Ich behalte es hier bei S-Tier, weil, wenn Sie Claude Code verwenden

00:06:19und es ernst meinen mit dem Bauen, werden Sie einen 100-Dollar-Monatsplan haben, mindestens,

00:06:24oder 200 Dollar im Monat. Und wir können hier sitzen und uns über die Nutzungen und all das beschweren,

00:06:29aber die Tatsache bleibt, es gibt einen Grund, warum dies im Wesentlichen ein Industriestandard geworden ist.

00:06:33Es ist gut. Und Sie müssen bedenken, selbst bei einem 100-Dollar- oder 200-Dollar-Monatspreis

00:06:38erhalten Sie immer noch eine 90-prozentige Reduzierung dessen, was Ihre normale Token-Nutzung kosten würde, wenn Sie

00:06:44die APIs für so etwas wie Opus 4.7 verwenden würden. Nun, gibt es ein sehr lautes Kontingent von Leuten, die

00:06:50sagen: Hey, Claude Code wurde generft. Opus 4.6 wurde generft. Es gibt Probleme mit 4.7. Ja.

00:06:55Aber ich denke, das hat viel mehr mit der Realität der Online-Diskussion über jedes Tool zu tun,

00:07:02das beliebt wird. Und ehrlich gesagt, mehr mit einer Reihe von Skill-Problemen, als es um irgendeine geheime Verschwörung geht, um

00:07:08Claude Code zu nerfen. Nur weil Claude Code S-Tier ist, bedeutet das jedoch nicht, dass es das einzige Spiel in

00:07:12der Stadt ist, denn wenn Sie wirklich der Meinung sind, dass Anthropic den Bach runtergeht und diese Opus 4.6- und

00:07:194.7-Veröffentlichungen minderwertig waren. Nun, Sie haben Optionen, nämlich Codex, das ist OpenAIs, Sie wissen schon,

00:07:26die Macher von ChatGPTs Version von Claude Code. Und ich sage Ihnen gleich, es ist auch S-Tier. Und

00:07:31es hat einige ernsthafte Vorteile gegenüber Claude Code. Der wichtigste ist die Nutzung. Ich kann viel mehr

00:07:38Token aus Codex herausholen als aus Claude Code. Obendrein sind OpenAIs Modelle gut. Was auch immer

00:07:45Sie mit Opus 4.6 oder 4.7 tun, kann mit GPT 5.4 getan werden, vielleicht an den Rändern. Und wir sprechen

00:07:52über extreme Komplexität. Sie können für das eine oder das andere argumentieren, und es wird massenhaft Leute geben, die

00:07:56für die OpenAI-Modelle gegenüber den Anthropic-Modellen argumentieren, aber für 99% der Leute gibt es wirklich keinen

00:08:02riesigen Unterschied. Und wenn es also heißt: Hey, sollte es Claude Code sein oder sollten wir Codex verwenden?

00:08:07Die Antwort ist einfach: Wählen Sie eins. Was ist Ihre persönliche Präferenz. Nun, was ist mit so etwas

00:08:12wie Anti-Gravity, das die Rolle von Harness/IDE spielt, irgendwie, irgendwie immer noch in dem Raum

00:08:18zwar. Wo geht das hin? Nun, vor nicht allzu langer Zeit hätte ich es in S-Tier eingestuft und gesagt, es gäbe eine Art

00:08:21Triumvirat da oben bei diesen Coding-Agenten, aber heutzutage würde ich es in A-Tier einordnen. Die Wahrheit

00:08:27ist: Anti-Gravity ist bei Verwendung mit den anderen Google-Modellen wie Gemini 3.1 einfach nicht so gut,

00:08:32wenn es um Claude Code mit Opus oder Codex mit so etwas wie 5.4 geht, wären Sie besser dran, wenn Sie

00:08:39Anti-Gravity mit diesen anderen Modellen verwenden, was dann die Frage aufwirft: Warum überhaupt die Anti-Gravity-

00:08:44Hülle darum herum verwenden? Warum nicht einfach etwas wie Claude Code oder OpenAI mit ihren

00:08:49nativen Modellen verwenden, für die es tatsächlich gebaut wurde. Darüber hinaus fangen Sie an, einige Leute sehen zu können, die sich

00:08:52über Nutzungsprobleme mit Anti-Gravity beschweren. Als es herauskam, gaben sie einem pretty much

00:08:58volle Nutzung für immer kostenlos, so fühlte es sich an. Nun, das nächste Tool, über das wir sprechen, ist nicht wirklich ein

00:09:03Coding-Agent oder Harness, bisher, es wird oft mit den anderen besprochen, also werden wir es

00:09:07hier einschließen und das ist OpenClaw. Nun, ich war in der Vergangenheit ziemlich lautstark über meine Abneigung gegen OpenClaw

00:09:12und um ehrlich zu sein, hat sich das nicht geändert. Ich würde es als C-Tier und wohl D-Tier einordnen. OpenClaw

00:09:18ist Performance-Theater. Wenn Sie OpenClaw verwenden, fühlt es sich an, als würde viel passieren. Wir machen

00:09:23Dashboards, wir verbinden Sachen, es hat einen Herzschlag, es spricht mit mir. Es gibt viel

00:09:28Bewegung, aber es gibt keine große Vorwärtsbewegung. Sie haben das Gefühl, Sie tun Sachen und für

00:09:32viele Leute reicht das, aber die Tatsache ist: was vier Monate später, drei Monate später und das wird

00:09:39auch drei Jahre von jetzt an der Fall sein. Ich warte immer noch darauf, dass jemand kommt und mir sagt: Oh, hier ist

00:09:44dieser OpenClaw-Anwendungsfall, den ich mache, der nicht innerhalb von Claude Code oder Codex gemacht werden kann und nicht

00:09:52effizienter durch Claude Code oder Codex gemacht werden kann, und wenn Sie mir sagen, es ist ein Morgenbericht oder eine Art

00:09:57Briefing, werde ich Sie vom Kanal verbannen. Und dieses niedrige Ranking von OpenClaw ist nur noch deutlicher geworden,

00:10:02seit Anthropic herauskam und sagte, Sie können Ihr Max-Abonnement nicht innerhalb von OpenClaw verwenden,

00:10:10was bedeutet, Sie müssen API-Preise für etwas wie Opus 4.7 zahlen. Nun, Caveat: buchstäblich heute etwas

00:10:16kam heraus, wo sie sagen: Oh nein, uh, es steht in den OpenClaw-Docs, wo es heißt, wir haben mit jemandem

00:10:21vom Personal bei Anthropic gesprochen und sie sagten, es ist jetzt gut. Ich, ich habe das Gefühl, wir brauchen ein wenig mehr Beweise als

00:10:28irgendeinen Einzeiler in ihrer eigenen Dokumentation, der sagt, wir haben mit einem Typen gesprochen. Also bis das bestätigt ist, ist es

00:10:36verrückt zu denken, dass OpenClaw eine Art Claude-Code-Ersatz ist, und ich verstehe, sie sind noch nicht

00:10:40dasselbe, doch die Leute werden dies über die anderen verwenden oder sie werden sagen: Oh nein, mein OpenClaw ruft Claude Code

00:10:46an, um Dinge zu tun. Warum? Warum rufen Sie nicht selbst Claude Code an? Und ich beende diese Diskussion hier

00:10:52irgendwie, aber OpenClaw und, irgendwie so ziemlich die gleiche Art von Sache mit Hermes, oder? Ich denke, Hermes ist ein wenig

00:10:59besser, aber ich werde es als solides C-Tier einordnen: das ist nur Produktivitätstheater. Fühlt sich an, als würden wir eine Menge tun,

00:11:06aber Sie können das alles innerhalb eines echten Coding-Agenten tun, das können Sie einfach. Nun, Hermes hat irgendwie

00:11:12einige kluge Dinge am Laufen mit, Sie wissen schon, diesen sich selbst aktualisierenden Fähigkeiten, aber die sich selbst aktualisierenden Fähigkeiten

00:11:18Sache kommt auch sehr nah an diese Illusion von etwas Gutem, das passiert, wo es heißt: Oh nein,

00:11:25alle 15 Tool-Aufrufe schaut es sich seine Fähigkeiten an und schreibt sie um, wie, muss es das?,

00:11:29Wie bestimmen wir, dass diese neue tatsächlich funktioniert? Warum würde ich nicht einfach Claude Code verwenden und so etwas

00:11:36wie die Skill-Creator-Skill verwenden, um sich die Fähigkeiten anzusehen, die ich regelmäßig verwendet habe oder ich

00:11:40weiß nicht, mir die Ergebnisse tatsächlich selbst ansehen und bestimmen, ob wir das tun müssen. Also diese Art von

00:11:46Tools, Sie könnten auch so etwas wie Paperclip hier hineinwerfen: eine Menge los, nichts passiert.

00:11:53Nun, Sie werden bemerken, ich behandle einige andere beliebte Coding-Harnesses nicht, Dinge wie

00:11:58Open Code. Die Wahrheit ist, ich habe sie einfach nicht sehr oft benutzt, ich habe nicht das Gefühl, dass ich

00:12:01intelligent darüber sprechen kann, und das wird, denke ich, eine Diskussion, die in die Open-Source-Modell-

00:12:08Route geht, die meiner Meinung nach ein ganz anderer Weg nach vorne ist. Ich denke, wenn Sie tief in der Open-Source-Open-

00:12:15Modell-Art-Route sind, wissen Sie irgendwie schon, was Sie tun, weil die Durchschnittsperson nicht

00:12:21an diesem Zeug herumbastelt, noch haben sie die Hardware, um das überhaupt auf irgendeinem Niveau zu tun. Das

00:12:25gesagt, ich habe nichts als Gutes über Sachen wie Open Code und Pi gehört, also wenn Sie es mögen, machen Sie weiter

00:12:29damit. Lassen Sie uns jetzt zu einigen dieser No-Code-Builder übergehen, Dinge wie Lovable und N8N, und ich verstehe, es gibt

00:12:36eine gewisse Abgrenzung dazwischen, wie automatisierungsvorwärts-Sachen wie N8N und Lovable, aber wir werden

00:12:40sie alle unter einem Dach bewerten, und also zuerst ist Lovable. Lovable. Wenn Sie mir diese

00:12:48Frage vor neun Monaten stellen würden, Lovable, hätte ich es in S-Tier gehabt, ich habe Lovable geliebt, als es

00:12:56herauskam, es nahm so ziemlich diese Basis von dem, was, was war es, 3.5 Sonnet zu der Zeit, Opus

00:13:023 zu der Zeit und stimmte es wirklich darauf ab, Ihnen ein großartiges Front-End-Design zu geben, und obwohl es irgendwie

00:13:08teuer war, schien es nicht verrückt. Nun, Lovable, es ist so: Was ist der Punkt? Was ist der Punkt? Ist

00:13:16Lovable in einem Jahr, zwei Jahren noch da? Wann würden Sie jemandem vorschlagen, Lovable zu verwenden

00:13:27wenn es keinen Punkt gibt? Es gibt keinen Punkt, wenn Codex existiert, wenn Claude Code existiert, wenn sogar einige der

00:13:33diese Chatbots existieren, zahlen Sie einen wahnsinnigen Aufpreis, um so etwas wie ein Ein-Klick-Superbase-

00:13:40Setup oder ein Ein-Klick-Deploy zu haben, und diese anderen Systeme sind so gut geworden, besonders Sachen wie

00:13:47Claude Code beim Erstellen von Front-End-Designs, die genauso gut sind wie das, was Lovable produziert, dass es

00:13:52ist wie: Worauf setzen Sie den Preis für Bequemlichkeit? Wie viel sind Sie bereit, pro

00:13:57Monat für Bequemlichkeit zu zahlen, denn es ist ein wahnsinniger Aufpreis, und ab einem gewissen Punkt spielt die Bequemlichkeit

00:14:01keine Rolle, denn wenn Sie eine echte App bauen, gibt es irgendeine Art von technischer Komplexität oder

00:14:06zumindest Straßensperren, die Sie navigieren müssen, egal was passiert, und wenn Sie das könnten, könnten Sie

00:14:11das in diesen, Sie könnten das in Anti-Gravity tun. Also ist Lovable keineswegs ein schlechtes Produkt, aber

00:14:17wenn Sie es mit der Konkurrenz und irgendwie dem Ökosystem im Großen und Ganzen vergleichen, ist es schwer, seine

00:14:23Existenz zu rechtfertigen. Ich meine, empfiehlt heutzutage irgendjemand Lovable? Ich tue es sicherlich nicht, und das gilt auch für

00:14:29Bolt, das ist an diesem Punkt nur eine weitere Version von Lovable. Erinnern Sie sich, als Bolt zum ersten Mal

00:14:33herauskam, es war irgendwie wild, wie, oh mein Gott, dieses Ding erstellt eine App von Grund auf, und was sind wir,

00:14:38anderthalb Jahre später, ich bin so: Ah, D-Tier, würde es niemals empfehlen. Sie sind so: Das ist ein toter

00:14:43Raum. Und wenn ich nicht Ihre Sachen wie Base 44 und diese Arten von Dingen habe, wie Replit,

00:14:49ich denke, da gehen sie auch hin. Ich habe sie nicht genug benutzt, um Ihnen eine großartige Antwort zu geben,

00:14:53aber wieder, ich denke, wenn Sie in die Zukunft blicken und sehen, dass Sie letztendlich konkurrieren

00:14:59gegen Claude Code und Codex und Anti-Gravity, werden sie nur benutzerfreundlicher werden. Ich meine,

00:15:05schauen Sie sich Sachen wie Co-Work an, es wird benutzerfreundlicher sein, und Sie, der kulturelle Zeitgeist

00:15:11hier ist: Claude, Claude, Claude, Claude. Wenn Sie Replit sind, wenn Sie Base 44 sind, sicherlich wenn Sie Bolt oder Lovable sind,

00:15:17welche Chance haben Sie langfristig? Ich glaube nicht, dass es gut aussieht. Nun, Cursor ist ein interessanter

00:15:22Fall, weil es in Kombination mit Claude Code und Codex verwendet werden kann, und ich habe das eine lange

00:15:27Zeit getan. Ich habe Cursor im Wesentlichen als meine IDE, als mein VS Code auf Steroiden benutzt, und habe Claude Code

00:15:34benutzt, und die Idee war: Okay, dass Claude Code 99% der Arbeit erledigen wird, aber wenn ich jemals querchecken will

00:15:39die Arbeit, nun, ich bin innerhalb von Cursor, also wissen Sie, ich könnte ein GPT 5.4 einen direkten Blick auf die

00:15:46Arbeit werfen lassen, die Claude Code erledigt hat, und sagen: Hey, das war gut, das war schlecht. Es war ein sehr einfach zu benutzendes zweites Paar Augen.

00:15:52Heutzutage, was brauchen wir das? Nun, erstens brauchen Sie es sicherlich nicht, weil ich Codex innerhalb

00:16:02von Claude Code verwenden kann. Es gibt ein Plugin, das wir verwenden können, und wir können es Code-Review, adversariales Code-Review

00:16:08durchführen lassen, also ist dieser spezielle Anwendungsfall vom Tisch. Lieben wir Composer 2.0? Ich, vielleicht tun Sie es, wenn das der

00:16:15Fall ist und Sie lieben Composer, vielleicht ist es A-Tier, vielleicht ist es irgendwie wie im Anti-Gravity-Raum, aber für

00:16:21mich heutzutage, würde ich sagen, es ist B-Tier. Es ist überhaupt kein schlechtes Produkt, verstehen Sie mich nicht falsch, ich sage nicht,

00:16:25dass Sie Cursor nicht verwenden sollten. Ich denke, es ist ein großartiges Produkt, es ist nur wieder, wer ist der Cursor-

00:16:30Kunde und warum wählen sie Cursor gegenüber diesen anderen Typen? Ich, ich denke, es ist eine Stufe

00:16:37entfernt von diesem ganzen Lovable-Problem, und ich hätte wahrscheinlich über diese Typen

00:16:41im letzten Abschnitt sprechen sollen, aber Gemini CLI, nennen Sie 10 Leute, die Gemini CLI verwenden, die nicht für Google arbeiten.

00:16:47Verstanden. Ich denke, ich durch die Tatsache, dass es buchstäblich von der Diskussion abwesend ist, und wieder: Benutzt das

00:16:55tatsächlich jemand? Wenn die Antwort nein ist, gibt es wahrscheinlich einen Grund dafür. Ich, ich weiß buchstäblich nicht

00:16:59von einer einzigen Person, die Gemini CLI verwendet oder angegeben hat, dass sie es verwendet, die nicht buchstäblich ein

00:17:04Google-Mitarbeiter ist, und ich denke, das spricht Bände. Nun, wie steht es mit N8N? Oh, ich war lange Zeit ein Super-N8N-Fanboy,

00:17:11also war das eine lange, lange Zeit automatisch S-Tier. Heutzutage ging N8N von: Dies ist

00:17:18das Go-to-Tool, das Sie verwenden sollten, um KI-Agenten und Automatisierungen ohne Code zu erstellen, zu einem sehr Nischen-

00:17:26Tool, denn seien wir ehrlich: alles, was N8N tun kann, kann Claude Code tun, alles, was N8N tun kann, kann Codex

00:17:33tun, und wenn Sie ein Tool sind, bei dem ich sagen kann: Alles, was Sie tun, kann Claude Code oder Codex besser tun, dann sollte es einen

00:17:40sehr überzeugenden Grund oder ein überzeugendes Unterscheidungsmerkmal geben, ob das Benutzerfreundlichkeit, Kosten, Nische ist, um

00:17:48Ihre Existenz zu rechtfertigen. Für N8N hat das immer noch das, und ich denke, es ist Nische und Benutzerfreundlichkeit, aber ich, also benutze ich

00:17:55N8N heutzutage nur für Kundenprojekte, wenn es ein Kundenprojekt für ein sehr nicht-technisches Team ist, wo

00:18:01aus welchem Grund auch immer sie auch praktisch sein müssen, also werden sie irgendwann die Fähigkeit brauchen,

00:18:06in die Automatisierung zu gehen und vielleicht eine oder zwei Dinge zu optimieren. N8N macht das sehr einfach zu tun, die

00:18:11visuelle Einrichtung ist großartig, aber ich meine, wieder, die Benutzerfreundlichkeit wird jetzt zum Unterscheidungsmerkmal von N8N. Es ist nicht

00:18:19weil es irgendwie schneller ist als Claude Code. Ich kann hochfahren, ich kann hochfahren und ich kann

00:18:27N8N-Automatisierungen schneller innerhalb von Claude Code erstellen, als ich das durch N8N selbst tun kann, das ist irgendwie ein

00:18:32Problem für die langfristige Lebensfähigkeit, denke ich. Ich meine, also ging es von, denke ich, irgendwie allgegenwärtig in diesem

00:18:39No-Code-KI-Raum zu: vielleicht, wenn Sie es aus einem bestimmten Grund brauchen und Sie eine Rechtfertigung brauchen,

00:18:45um das zu tun, aber das Produkt selbst hat sich nicht geändert. Es tut immer noch, was es tut, sehr gut, aber N8Ns

00:18:50direkte Konkurrenz, wie Make und Zapier, D-Tier: teurer, weniger Flexibilität, warum sich die Mühe machen? Also wieder,

00:19:00was ist Ihr Unterscheidungsmerkmal? Wenn Sie das nicht tun können, werden Sie sterben, also weiß ich nicht, warum irgendjemand

00:19:04überlassen wir das den Nachzüglern.

00:19:09Wo ordnen wir NotebookLM ein? Es ist irgendwie ein

00:19:15Nischen-KI-Tool. Es ist kein Coding-Agent, kein reines

00:19:20No-Code-Tool, obwohl man argumentieren könnte, dass

00:19:25es eines ist. Wenn ich ihm einen Prompt und Kontext gebe, erstellt es Dinge für mich. Wie auch

00:19:33immer, NotebookLM ist fantastisch und definitiv S-Tier für ein einzelnes KI-Tool. Ich halte

00:19:38NotebookLM für das beste Produkt von Google, ehrlich gesagt. Und die Tatsache, dass ich es

00:19:43in Claude Code integrieren kann oder mit Anti-Gravity unter Verwendung von Tools wie dem

00:19:50NotebookLM PI CLI, ist ein enormer Produktivitätsschub. Und Google lässt einen so viel

00:19:55davon kostenlos nutzen, was verrückt ist. Man kann damit wirklich gute Ergebnisse erzielen,

00:20:01wie Foliensätze, Infografiken, und es ist meiner Meinung nach der beste Weg für jede Art von

00:20:07Recherche, die viele YouTube-Videos beinhaltet. Ich habe eine Menge Inhalte über die

00:20:13Kombination von Claude Code und NotebookLM gemacht, und zwar aus gutem Grund, denn

00:20:20NotebookLM ist großartig und kostenlos. Ein weiteres Tool, über das wir nicht gesprochen

00:20:26haben, das wir aber vielleicht bei den Chatbots hätten erwähnen sollen, ist Perplexity. Nun,

00:20:34ist Perplexity ein Chatbot? Nutzt jemand Perplexity als seinen einzigen eigenständigen

00:20:40Chatbot? Vielleicht. Das Argument bei Perplexity ist heutzutage, dass es der Chatbot ist,

00:20:47der einen eine Reihe anderer Chatbots nutzen lässt. Aber lange Zeit war es für mich S-Tier.

00:20:53Und wieder, wie so viele Tools, beginnt es heutzutage abzufallen. Ich würde Perplexity

00:20:58in die C-Tier einordnen. Und vielleicht liegt das zu einem großen Teil daran, dass ich

00:21:03Perplexity's Peripherie-Tools wie Pages oder deren Browser nicht nutze. Und deshalb

00:21:10nutze ich Perplexity wirklich nur, und ich habe den Pro-Plan, wenn ich sage: "Alles klar,

00:21:16ich möchte einfach Informationen über etwas, das heute passiert ist, und ich möchte die

00:21:22Quellen dazu". Und ich möchte nicht explizit Claude oder ChatGPT dazu auffordern müssen,

00:21:28eine Websuche durchzuführen, um diese echten Daten zu bekommen. In gewissem Sinne ist

00:21:33es fast wie Grok auf Steroiden, wo es wirklich gut darin ist, Web-Daten abzurufen, und es

00:21:42ist dafür gebaut. Aber noch einmal: Ist es ein täglicher Begleiter? Nein. Ist es wert,

00:21:49dafür 20 Dollar im Monat zusätzlich zu all diesen anderen Tools zu zahlen? Nein. Es ist ein

00:21:55"Nice-to-have". Und in unserer letzten Kategorie sprechen wir über einige dieser

00:22:00Content-Creation-Tools, Bildgeneratoren, Videogeneratoren und so weiter. Nun,

00:22:05zuerst auf der Liste ist ein aktuelles Produkt, und das ist Design von Claude. Im luftleeren

00:22:12Ich denke also, am Ende des Tages ist es eine B-Note, wir teilen das einfach mal auf: großartiges Tool, sobald

00:22:18eine Tonne benutzt, und es ist ein riesiger Schritt nach vorne gegenüber dem normalen

00:22:23Claude Code und auch ein großer Fortschritt gegenüber den meisten Skills, die man da draußen

00:22:26sieht. Dinge wie – nun, sicherlich der Frontend-Design-Skill, der UI/UX-Pro-Skill,

00:22:32stellt es in den Schatten, und direkt von Anfang an macht es einen großartigen Job,

00:22:39indem es dir ermöglicht, sehr schnell eine Reihe von Visuals zu iterieren. Jedoch, Komma,

00:22:50die Nutzung ist das Schlimmste, was ich je in meinem Leben gesehen habe. Man verbrennt

00:22:55Tokens mit einer verrückten Rate. Ich bekomme keine zusätzliche Nutzung, obwohl ich 200

00:23:00Dollar im Monat bezahle. Ich habe die gleiche Nutzung wie jemand auf Pro. Warum? Und es

00:23:06ist überhaupt nicht klar, was das alles auffrisst, obwohl es nach einigem Experimentieren,

00:23:11nachdem man alles verbraucht hat, sehr offensichtlich wird. Ein Design-System zu erstellen

00:23:21kann 30 Prozent deiner Tokens kosten. Nach einer einfachen Landingpage zu fragen, kann

00:23:26etwa fünf Prozent deiner Tokens verbrauchen. Die Nutzung ist also schwierig. Im luftleeren

00:23:33Raum S-Tier, in der Nutzung D-Tier. Also denke ich, am Ende des Tages ist ein B-Tier ein

00:23:40guter Kompromiss. Großartiges Tool, sobald sie die Nutzung im Griff haben, wird es

00:23:47erstaunlich sein, eines der besten Produkte, um ehrlich zu sein, aber momentan ist es für

00:23:53die durchschnittliche Person nicht wirklich nutzbar. Ich verbrauche bereits extra Tokens

00:23:59dafür. Oh ja, Copilot. Ich habe nicht einmal Copilot erwähnt. Ich habe vergessen, dass dieses

00:24:04Ding überhaupt dabei war, spricht wahrscheinlich für sich selbst. Copilot benutzt man, wenn

00:24:11man dazu gezwungen wird. Niemand benutzt das von sich aus. Es gibt einige Argumente, dass es

00:24:20anständig ist, so okay, es ist in das Unternehmen selbst integriert. Also die C-Tier, ich

00:24:28gebe ihm C-Minus-Tier. Ich weiß nicht, die Tatsache, dass ich es sogar vergessen habe zu

00:24:34erwähnen, sagt wahrscheinlich schon viel aus. Nun, Kling 3.0. Wenn ihr nicht wisst, was

00:24:42Kling 3.0 ist: Es ist ein Videomodell und es ist ein solides A-Tier, wirklich gute Sachen.

00:24:49Die direkte Konkurrenz ist Veo 3, nun, Veo 3.1 heutzutage, das ich in die B-Tier einordnen

00:24:56würde. Es veraltet zu diesem Zeitpunkt irgendwie und es ist sehr teuer, was die andere Sache

00:25:01ist. Und dann haben wir SeaDance 2.0. Wenn ihr in letzter Zeit irgendein KI-Video gesehen

00:25:09habt, war es SeaDance. Erinnert ihr euch an all diese Videos vor einem Monat, als es die

00:25:15eingebettete Beta von all den Dingen wie Schauspielern und Filmszenen war, die nachgestellt

00:25:20wurden? Das war SeaDance. Und SeaDance ist großartig, definitiv ein Schritt nach vorne

00:25:24gegenüber Veo und Kling. Die Visuals sind wild, es ist wild und überraschend nicht so

00:25:30teuer im Vergleich. Und dann haben wir unsere Bildmodelle. Nano Banana Pro ist S-Tier, es

00:25:36ist schon seit einiger Zeit erstklassig. Und dann haben wir auch das brandneue Image Gen 2

00:25:40von GPT. Nun, nach dem Wenigen, was ich damit gespielt habe, und das kam gerade erst heraus,

00:25:47würde ich es S-Tier nennen, aber ich habe es nicht genug benutzt und nicht genug Edge Cases

00:25:53gesehen. Das ist also eines dieser Szenarien, wo man sagt, wenn man davon überzeugt ist, S-Tier.

00:25:59Wenn man abwarten will, ist es zumindest A-Tier. Also halten wir es vorerst in der A-Tier,

00:26:05wir werden sehen, wie es sich hält. Aber das gesagt, ein großartiges Bildmodell ist ein großer

00:26:10Vorteil für ChatGPT, weil Tonnen von Menschen das benutzen. Tonnen von Menschen nutzen Image Gen.

00:26:15Und einer der großen Unterscheidungsmerkmale für Gemini gegenüber ChatGPT waren schon immer

00:26:20seine überlegenen Bildmodelle. Also, hier sind wir gelandet. Ich hoffe, das wirft etwas Licht

00:26:25darauf, worauf ihr euch konzentrieren solltet und was eure Zeit nicht wirklich wert ist. Und

00:26:31hoffentlich brachte es sogar einige neue KI-Tools zur Sprache, von denen ihr noch nie gehört

Key Takeaway

Für professionelle Anwendungsfälle und Coding-Projekte sind spezialisierte Coding-Agenten wie Claude Code oder Codex das Maß der Dinge, während Gemini 3.1 das beste ganzheitliche Preis-Leistungs-Verhältnis für den täglichen Chatbot-Gebrauch bietet.

Highlights

Gemini 3.1 ist der beste tägliche KI-Chatbot für 20 Dollar pro Monat, da es im Gegensatz zur Konkurrenz Videoinhalte wie YouTube-Videos und TikToks nativ analysieren kann.
Claude Code ist der Industriestandard für Coding-Agenten, wobei Nutzer bei einem 100- bis 200-Dollar-Monatsplan eine 90-prozentige Reduzierung der Token-Kosten gegenüber Opus 4.7-API-Direktabrufen erzielen.
OpenClaw und Hermes werden als Produktivitätstheater eingestuft, da alle ihre Funktionen effizienter innerhalb von Claude Code oder Codex ausgeführt werden können.
Lovable und Bolt verlieren als No-Code-Builder langfristig an Bedeutung, da allgemeine Coding-Agenten wie Codex und Claude Code mittlerweile Front-End-Designs in vergleichbarer Qualität liefern.
NotebookLM ist das leistungsfähigste kostenlose KI-Tool für Recherchen und die Erstellung von Foliensätzen oder Infografiken aus YouTube-Inhalten.
Design von Claude ermöglicht eine schnelle Iteration von Visuals, hat jedoch in der aktuellen Version eine so hohe Token-Verbrauchsrate, dass es für die meisten Nutzer unpraktisch ist.
SeaDance 2.0 führt den Videogenerierungsmarkt an und bietet eine deutlich höhere visuelle Qualität als Veo 3.1 oder Kling 3.0.

Timeline

KI-Chatbots im Vergleich

ChatGPT fungiert als solider Durchschnittschatbot, der vor allem durch seine Bildgenerierung Extras bietet.
Gemini 3.1 ist die beste Wahl für den täglichen Begleiter aufgrund seiner Fähigkeit zur Videoanalyse und Bildgenerierung für 20 Dollar.
Claude (Opus 4.7) bietet hohe Qualität, wird aber bei einem 20-Dollar-Plan durch strikte Nutzungseinschränkungen behindert.
Grok ist primär für Twitter-affine Nutzer nützlich, bietet jedoch schlechtere Coding- und Videofunktionen als die Konkurrenz.

Die Bewertung der Chatbots erfolgt auf Basis von täglicher Nutzbarkeit und Leistungsfähigkeit. Während ChatGPT das Standard-Modell 5.4 nutzt, punktet Gemini 3.1 mit multimodalen Fähigkeiten, die besonders die Videoanalyse von sozialen Medien umfassen. Claude überzeugt zwar durch das leistungsstarke Opus 4.7-Modell, ist für den durchschnittlichen Nutzer jedoch aufgrund starker Drosselung bei Einsteigerplänen eher ein C-Tier-Produkt.

Coding-Agenten und Harnesses

Claude Code ist aufgrund seiner Effizienz und breiten Anwendung der Industriestandard für KI-Entwickler.
OpenAI Codex bietet als Alternative eine ähnliche Leistung wie Claude Code, ermöglicht jedoch eine höhere Token-Ausnutzung.
OpenClaw und Hermes werden als ineffizientes Produktivitätstheater bewertet, da sie lediglich oberflächliche Fortschritte simulieren.
Anti-Gravity wurde vom S-Tier in das A-Tier herabgestuft, da native Lösungen mittlerweile eine höhere Flexibilität bieten.

Coding-Agenten stehen im Mittelpunkt der modernen Entwicklung. Claude Code und Codex sind die primären Werkzeuge, wobei die Wahl zwischen ihnen oft von persönlichen Präferenzen abhängt. Werkzeuge wie OpenClaw oder Hermes simulieren zwar Aktivität durch Dashboards und automatische Skill-Updates, bieten jedoch keinen tatsächlichen Mehrwert gegenüber der direkten Nutzung von Claude Code oder Codex.

No-Code-Builder und Produktivitäts-Tools

Lovable und Bolt haben ihre Existenzberechtigung verloren, da Coding-Agenten mittlerweile gleichwertige Front-End-Ergebnisse liefern.
Cursor wird als B-Tier-Produkt eingestuft, da seine ursprüngliche Rolle als Kontrollinstanz durch Plugins in Claude Code obsolet wurde.
N8N ist nur noch für spezifische Nischenprojekte in nicht-technischen Teams relevant, da Coding-Agenten Automatisierungen mittlerweile schneller erstellen.

Der Bereich No-Code-Builder steht unter massivem Druck durch Coding-Agenten. Da Systeme wie Claude Code mittlerweile komplexe Front-Ends in professioneller Qualität erstellen, rechtfertigen die hohen Aufpreise für Tools wie Lovable oder Bolt nicht länger den Komfortgewinn. N8N bleibt ein starkes Tool für einfache Automatisierungen, verliert aber an Bedeutung, da die gleichen Abläufe durch Coding-Agenten effizienter und kostengünstiger realisiert werden.

Spezial- und Content-Erstellungs-Tools

NotebookLM gilt als bestes Google-Produkt für Rechercheaufgaben und die Aufbereitung von YouTube-Inhalten.
Perplexity ist ein nützliches Zusatztool zur Web-Recherche, eignet sich aber nicht als täglicher Standard-Chatbot.
Design von Claude bietet beeindruckende visuelle Iterationen, leidet jedoch unter einem exzessiven Token-Verbrauch bei Design-Systemen.
SeaDance 2.0 ist derzeit das führende Modell für KI-Video, während Nano Banana Pro weiterhin S-Tier für Bildgenerierung bleibt.

In der abschließenden Kategorie sticht NotebookLM durch seine kostenlose und leistungsstarke Recherchefunktion hervor. Tools zur Content-Erstellung wie Design von Claude zeigen zwar hohes Potenzial bei der UI/UX-Gestaltung, sind aber aufgrund der hohen Token-Kosten momentan für den Alltagsgebrauch nur eingeschränkt zu empfehlen. Videogeneratoren wie SeaDance 2.0 setzen neue Standards in der visuellen Qualität.

Community Posts

Write about this video