Ranking aller KI-Tools, die ich 2026 genutzt habe (Was TATSÄCHLICH gut ist)

CChase AI
Computing/SoftwareSmall Business/StartupsManagementInternet Technology

Transcript

00:00:00Es gibt im Jahr 2026 viel zu viele KI-Tools, und es ist unmöglich geworden, herauszufinden,
00:00:05welche davon tatsächlich ihre Zeit und ihr Geld wert sind. Und weil ich nichts Besseres zu tun habe,
00:00:10habe ich in den letzten Monaten eine ganze Menge davon getestet. Und heute werde ich sie alle
00:00:15bewerten. Ich werde alles behandeln, von einfachen Chatbots bis hin zu vollwertigen Coding-Agenten und
00:00:20alles dazwischen. Am Ende dieses Videos wissen Sie also, auf welche Sie sich tatsächlich konzentrieren sollten.
00:00:27Wir bewerten das Ganze im Standard-Tier-List-Format. S-Tier ist das Beste,
00:00:32D-Tier ist das Schlechteste, und alle diese Tools werden nach ihrer Funktion gruppiert.
00:00:36Wenn es nun darum geht, das spezifische Tool zu bewerten, betrachten wir es durch zwei Linsen. Erstens: Wie
00:00:42schneidet es im Vergleich zu anderen Tools seiner Klasse ab? Wie schneidet also N8N im Vergleich zu anderen No-Code-Automatisierungstools
00:00:49wie Make oder Zapier ab? Aber wir betrachten es auch auf Makro-Ebene, denn man kann
00:00:56der Klassenbeste in etwas wie No-Code-Automatisierung sein. Aber bedeutet das automatisch S-Tier,
00:01:00nur weil man jeden in seiner Kategorie schlägt? Nicht unbedingt, denn das hängt alles irgendwie
00:01:05zusammen. Diese Tools spielen ineinander. Was vor sechs Monaten großartig war, könnte heute
00:01:11Probleme haben. Wenn ich also Ihre Lieblingstools als D-Tier einstufe, hinterlassen Sie unbedingt einen Kommentar und lassen Sie mich wissen,
00:01:14wie sehr Sie meine subjektiven und sehr vagen Bewertungskriterien hassen. Das werde ich beim nächsten Mal
00:01:20im Hinterkopf behalten. Fangen wir also mit den Chatbots an. Und der erste, den wir bewerten werden, ist ChatGPT. Nun,
00:01:26hier haben viele von uns angefangen. Und den Zahlen nach zu urteilen, sind die meisten Leute immer noch hier.
00:01:31Auf Makro-Ebene steigt ChatGPT für mich definitiv im Ranking, weil ihre Modelle
00:01:35so solide sind. 5.4 ist ein großartiges Modell. Wenn wir jedoch über den Chatbot selbst sprechen,
00:01:40komme ich zu dem Schluss: meh, es ist in Ordnung. Es ist zum ultimativen Durchschnitts-Chatbot geworden.
00:01:47Sie werden die Ausgaben nicht hassen. Sie werden die Ausgaben nicht lieben. Und leider,
00:01:51wenn Sie schlecht im Prompting sind, erhalten Sie sehr generische Antworten. Wir alle wissen inzwischen, wie wir
00:01:56ChatGPT-Texte erkennen. Aber für 20 Dollar im Monat bekomme ich eine Menge davon. Und es hat ein paar
00:02:00Extras wie Bildgenerierung. Und das neue Bildgenerierungsmodell ist tatsächlich wirklich gut.
00:02:04Und wo wir gerade von Bildgenerierung sprechen, lassen Sie uns über einen anderen Chatbot sprechen. Und das ist Gemini. Nun, Gemini,
00:02:10das sage ich Ihnen gleich vorweg: A-Tier. Ich denke, wenn Sie nur der Typ Mensch sind,
00:02:15der 20 Dollar im Monat für einen KI-Chatbot ausgibt und einfach nur einen täglichen Begleiter will, ist Gemini bei weitem die beste Wahl.
00:02:21Es ist in dieser Hinsicht besser als Claude. Und was meine ich damit? Sie werden genug
00:02:25Nutzen daraus ziehen, wie der Durchschnittsmensch. Darüber hinaus bietet mir Gemini Bildgenerierung
00:02:31und Nano Banana Pro, das Beste seiner Klasse. Ich kann Videogenerierung bekommen. Und wichtig: Was es besser
00:02:36macht als jedes andere Chat-Modell, ist das Verarbeiten von Videos selbst. Ich kann Gemini YouTube-Videos geben. Ich kann ihm
00:02:42Kurzvideos, Reels, TikToks, was auch immer geben, und es kann sie tatsächlich analysieren. Die anderen
00:02:46haben in diesem Bereich wirklich Probleme oder können es gar nicht. Nun, halte ich 3.1 im Vakuum
00:02:50für besser als 5.4 oder Opus, über das wir gleich sprechen werden? Nein. Aber ich denke, ganzheitlich betrachtet, für 20 Dollar
00:02:55im Monat, als täglicher Begleiter, sollten Sie Gemini verwenden. Und hier kommt Anthropic. Wo ordnen wir also Claude ein?
00:03:00Das ist schwierig, denn wenn wir über Claude und Opus 4.7 sprechen, Opus 4.7 ist das beste Modell in
00:03:08diesem Spiel gerade, zumindest meiner Meinung nach. Und ich denke, Anthropic ist der beste der
00:03:12drei großen Akteure. Wenn wir jedoch rein vom Chatbot sprechen und Sie einen 20-Dollar-Monatsplan
00:03:18haben, könnte man argumentieren, dass es C-Tier ist. Rein, rein basierend auf den Nutzungsproblemen. Wenn Sie in einem 20-Dollar-Monatsplan
00:03:26sind und versuchen, Opus für echte Projekte zu verwenden oder es tatsächlich dazu bringen wollen, irgendetwas
00:03:31zu generieren, werden Sie so schnell gegen eine Wand laufen und sich fragen: Was tue ich hier?
00:03:35Denn für 20 Dollar im Monat bekomme ich wahrscheinlich eine Ausgabe, die eine 95%-Lösung ist, und ich kann
00:03:41das eine Million Mal tun. Während Anthropic Ihre Nutzung ziemlich stark drosselt, wenn Sie
00:03:45nicht einen 100- oder 200-Dollar-Monatsplan haben. Wenn es außerdem um Sachen wie Sauna und Opus geht,
00:03:50kann es nur Text und Code und diese Artefakte. Ich kann keine Bilder machen. Ich kann kein Video machen. Es ist nur Text.
00:03:58Wenn Sie also der durchschnittliche KI-Nutzer sind, der nur einen Chatbot verwendet, würde ich argumentieren, dass es C-Tier ist.
00:04:05Wenn Sie jedoch einen 100-Dollar- oder 200-Dollar-Monatsplan haben, S-Tier. Es sei denn, Sie versuchen,
00:04:14Dinge mit Videos oder Bildern zu machen. Wenn es also um Claude geht, ist es sehr anwendungsfallabhängig und sehr
00:04:20nutzungsabhängig. Also für den durchschnittlichen Typ, der von der Straße kommt, einfach nur wissen will, für welche KI er
00:04:2520 Dollar im Monat zahlen sollte: C-Tier. Aber wenn Sie es ernst meinen, Sie haben einen 100-Dollar- oder 200-Dollar-Monatsplan: S-Tier.
00:04:31Und dann war da noch Grok. Wo ordnen wir Grok ein? Nun, es ist schlechter als alle diese bei Coding-Aufgaben.
00:04:37Es hat ein viel schlechteres Bildmodell als ChatGPT oder Gemini. Sein Videomodell ist schlechter als das von Gemini
00:04:44und eigentlich hat es nur den Vorteil, dass es weniger Leitplanken hat und es ist ziemlich gut, was das
00:04:50Herausfinden angeht, was in der realen Welt in diesem Moment gerade passiert.
00:04:55Es ist also großartig, wenn Sie Twitter-affin sind, vielleicht, wenn Sie Twitter-affin sind, ist es B-Plus-Tier. Für
00:05:00Ihren Durchschnittsnutzer: C-Tier. Um ehrlich zu sein. Und wenn wir darüber sprechen, oh, es ist großartig darin,
00:05:06Videos zu verarbeiten, wie, ich kann es mit einem Twitter-Ding füttern, es weiß, was los ist. Wiederum, wenn Sie
00:05:10hyper-fokussiert auf Twitter-Funktionalität sind, klar. Vielleicht A-Tier. Durchschnittsnutzer: Bestenfalls C-Tier. Sie würden
00:05:17das niemals jemandem empfehlen, der nicht vier Stunden am Tag auf Twitter verbringt. Bevor wir nun
00:05:21zu den Coding-Agent-Rankings springen, möchte ich nur kurz Werbung für meine Claude-Code-Masterclass machen.
00:05:26Sie ist erst letzten Monat herausgekommen und ist der beste Weg, um von Null zum KI-Entwickler zu werden, besonders wenn
00:05:31Sie keinen technischen Hintergrund haben. Ich aktualisiere das jede Woche und in letzter Zeit haben wir uns wirklich
00:05:35darauf konzentriert, wie man ein agentisches Betriebssystem aufbaut, das von Claude Code angetrieben wird und Dinge wie
00:05:42Obsidian für das Gedächtnis einbindet und GWS, um es mit Dingen wie Ihrer Google-Suite zu verbinden. Wenn Sie also daran interessiert sind,
00:05:48können Sie es innerhalb von Chase AI Plus finden, es gibt einen Link im angepinnten Kommentar. Das war's also für
00:05:52die Chatbots. Lassen Sie uns jetzt zu den Coding-Agenten oder diesen Coding-Harnesses wie Codex und
00:05:57Claude Code übergehen. Und wo wir gerade von Claude Code sprechen, das wird das erste sein, über das wir jetzt sprechen. Claude Code: S-Tier für mich.
00:06:03Jedoch dieselbe Art von Unterhaltung wie zuvor. Wovon sprechen wir in Bezug auf
00:06:10die Nutzung? Wenn Sie denken, Sie können mit einem 20-Dollar-Monatsplan zu Claude Code kommen und etwas daraus
00:06:15herausholen, irren Sie sich. Ich behalte es hier bei S-Tier, weil, wenn Sie Claude Code verwenden
00:06:19und es ernst meinen mit dem Bauen, werden Sie einen 100-Dollar-Monatsplan haben, mindestens,
00:06:24oder 200 Dollar im Monat. Und wir können hier sitzen und uns über die Nutzungen und all das beschweren,
00:06:29aber die Tatsache bleibt, es gibt einen Grund, warum dies im Wesentlichen ein Industriestandard geworden ist.
00:06:33Es ist gut. Und Sie müssen bedenken, selbst bei einem 100-Dollar- oder 200-Dollar-Monatspreis
00:06:38erhalten Sie immer noch eine 90-prozentige Reduzierung dessen, was Ihre normale Token-Nutzung kosten würde, wenn Sie
00:06:44die APIs für so etwas wie Opus 4.7 verwenden würden. Nun, gibt es ein sehr lautes Kontingent von Leuten, die
00:06:50sagen: Hey, Claude Code wurde generft. Opus 4.6 wurde generft. Es gibt Probleme mit 4.7. Ja.
00:06:55Aber ich denke, das hat viel mehr mit der Realität der Online-Diskussion über jedes Tool zu tun,
00:07:02das beliebt wird. Und ehrlich gesagt, mehr mit einer Reihe von Skill-Problemen, als es um irgendeine geheime Verschwörung geht, um
00:07:08Claude Code zu nerfen. Nur weil Claude Code S-Tier ist, bedeutet das jedoch nicht, dass es das einzige Spiel in
00:07:12der Stadt ist, denn wenn Sie wirklich der Meinung sind, dass Anthropic den Bach runtergeht und diese Opus 4.6- und
00:07:194.7-Veröffentlichungen minderwertig waren. Nun, Sie haben Optionen, nämlich Codex, das ist OpenAIs, Sie wissen schon,
00:07:26die Macher von ChatGPTs Version von Claude Code. Und ich sage Ihnen gleich, es ist auch S-Tier. Und
00:07:31es hat einige ernsthafte Vorteile gegenüber Claude Code. Der wichtigste ist die Nutzung. Ich kann viel mehr
00:07:38Token aus Codex herausholen als aus Claude Code. Obendrein sind OpenAIs Modelle gut. Was auch immer
00:07:45Sie mit Opus 4.6 oder 4.7 tun, kann mit GPT 5.4 getan werden, vielleicht an den Rändern. Und wir sprechen
00:07:52über extreme Komplexität. Sie können für das eine oder das andere argumentieren, und es wird massenhaft Leute geben, die
00:07:56für die OpenAI-Modelle gegenüber den Anthropic-Modellen argumentieren, aber für 99% der Leute gibt es wirklich keinen
00:08:02riesigen Unterschied. Und wenn es also heißt: Hey, sollte es Claude Code sein oder sollten wir Codex verwenden?
00:08:07Die Antwort ist einfach: Wählen Sie eins. Was ist Ihre persönliche Präferenz. Nun, was ist mit so etwas
00:08:12wie Anti-Gravity, das die Rolle von Harness/IDE spielt, irgendwie, irgendwie immer noch in dem Raum
00:08:18zwar. Wo geht das hin? Nun, vor nicht allzu langer Zeit hätte ich es in S-Tier eingestuft und gesagt, es gäbe eine Art
00:08:21Triumvirat da oben bei diesen Coding-Agenten, aber heutzutage würde ich es in A-Tier einordnen. Die Wahrheit
00:08:27ist: Anti-Gravity ist bei Verwendung mit den anderen Google-Modellen wie Gemini 3.1 einfach nicht so gut,
00:08:32wenn es um Claude Code mit Opus oder Codex mit so etwas wie 5.4 geht, wären Sie besser dran, wenn Sie
00:08:39Anti-Gravity mit diesen anderen Modellen verwenden, was dann die Frage aufwirft: Warum überhaupt die Anti-Gravity-
00:08:44Hülle darum herum verwenden? Warum nicht einfach etwas wie Claude Code oder OpenAI mit ihren
00:08:49nativen Modellen verwenden, für die es tatsächlich gebaut wurde. Darüber hinaus fangen Sie an, einige Leute sehen zu können, die sich
00:08:52über Nutzungsprobleme mit Anti-Gravity beschweren. Als es herauskam, gaben sie einem pretty much
00:08:58volle Nutzung für immer kostenlos, so fühlte es sich an. Nun, das nächste Tool, über das wir sprechen, ist nicht wirklich ein
00:09:03Coding-Agent oder Harness, bisher, es wird oft mit den anderen besprochen, also werden wir es
00:09:07hier einschließen und das ist OpenClaw. Nun, ich war in der Vergangenheit ziemlich lautstark über meine Abneigung gegen OpenClaw
00:09:12und um ehrlich zu sein, hat sich das nicht geändert. Ich würde es als C-Tier und wohl D-Tier einordnen. OpenClaw
00:09:18ist Performance-Theater. Wenn Sie OpenClaw verwenden, fühlt es sich an, als würde viel passieren. Wir machen
00:09:23Dashboards, wir verbinden Sachen, es hat einen Herzschlag, es spricht mit mir. Es gibt viel
00:09:28Bewegung, aber es gibt keine große Vorwärtsbewegung. Sie haben das Gefühl, Sie tun Sachen und für
00:09:32viele Leute reicht das, aber die Tatsache ist: was vier Monate später, drei Monate später und das wird
00:09:39auch drei Jahre von jetzt an der Fall sein. Ich warte immer noch darauf, dass jemand kommt und mir sagt: Oh, hier ist
00:09:44dieser OpenClaw-Anwendungsfall, den ich mache, der nicht innerhalb von Claude Code oder Codex gemacht werden kann und nicht
00:09:52effizienter durch Claude Code oder Codex gemacht werden kann, und wenn Sie mir sagen, es ist ein Morgenbericht oder eine Art
00:09:57Briefing, werde ich Sie vom Kanal verbannen. Und dieses niedrige Ranking von OpenClaw ist nur noch deutlicher geworden,
00:10:02seit Anthropic herauskam und sagte, Sie können Ihr Max-Abonnement nicht innerhalb von OpenClaw verwenden,
00:10:10was bedeutet, Sie müssen API-Preise für etwas wie Opus 4.7 zahlen. Nun, Caveat: buchstäblich heute etwas
00:10:16kam heraus, wo sie sagen: Oh nein, uh, es steht in den OpenClaw-Docs, wo es heißt, wir haben mit jemandem
00:10:21vom Personal bei Anthropic gesprochen und sie sagten, es ist jetzt gut. Ich, ich habe das Gefühl, wir brauchen ein wenig mehr Beweise als
00:10:28irgendeinen Einzeiler in ihrer eigenen Dokumentation, der sagt, wir haben mit einem Typen gesprochen. Also bis das bestätigt ist, ist es
00:10:36verrückt zu denken, dass OpenClaw eine Art Claude-Code-Ersatz ist, und ich verstehe, sie sind noch nicht
00:10:40dasselbe, doch die Leute werden dies über die anderen verwenden oder sie werden sagen: Oh nein, mein OpenClaw ruft Claude Code
00:10:46an, um Dinge zu tun. Warum? Warum rufen Sie nicht selbst Claude Code an? Und ich beende diese Diskussion hier
00:10:52irgendwie, aber OpenClaw und, irgendwie so ziemlich die gleiche Art von Sache mit Hermes, oder? Ich denke, Hermes ist ein wenig
00:10:59besser, aber ich werde es als solides C-Tier einordnen: das ist nur Produktivitätstheater. Fühlt sich an, als würden wir eine Menge tun,
00:11:06aber Sie können das alles innerhalb eines echten Coding-Agenten tun, das können Sie einfach. Nun, Hermes hat irgendwie
00:11:12einige kluge Dinge am Laufen mit, Sie wissen schon, diesen sich selbst aktualisierenden Fähigkeiten, aber die sich selbst aktualisierenden Fähigkeiten
00:11:18Sache kommt auch sehr nah an diese Illusion von etwas Gutem, das passiert, wo es heißt: Oh nein,
00:11:25alle 15 Tool-Aufrufe schaut es sich seine Fähigkeiten an und schreibt sie um, wie, muss es das?,
00:11:29Wie bestimmen wir, dass diese neue tatsächlich funktioniert? Warum würde ich nicht einfach Claude Code verwenden und so etwas
00:11:36wie die Skill-Creator-Skill verwenden, um sich die Fähigkeiten anzusehen, die ich regelmäßig verwendet habe oder ich
00:11:40weiß nicht, mir die Ergebnisse tatsächlich selbst ansehen und bestimmen, ob wir das tun müssen. Also diese Art von
00:11:46Tools, Sie könnten auch so etwas wie Paperclip hier hineinwerfen: eine Menge los, nichts passiert.
00:11:53Nun, Sie werden bemerken, ich behandle einige andere beliebte Coding-Harnesses nicht, Dinge wie
00:11:58Open Code. Die Wahrheit ist, ich habe sie einfach nicht sehr oft benutzt, ich habe nicht das Gefühl, dass ich
00:12:01intelligent darüber sprechen kann, und das wird, denke ich, eine Diskussion, die in die Open-Source-Modell-
00:12:08Route geht, die meiner Meinung nach ein ganz anderer Weg nach vorne ist. Ich denke, wenn Sie tief in der Open-Source-Open-
00:12:15Modell-Art-Route sind, wissen Sie irgendwie schon, was Sie tun, weil die Durchschnittsperson nicht
00:12:21an diesem Zeug herumbastelt, noch haben sie die Hardware, um das überhaupt auf irgendeinem Niveau zu tun. Das
00:12:25gesagt, ich habe nichts als Gutes über Sachen wie Open Code und Pi gehört, also wenn Sie es mögen, machen Sie weiter
00:12:29damit. Lassen Sie uns jetzt zu einigen dieser No-Code-Builder übergehen, Dinge wie Lovable und N8N, und ich verstehe, es gibt
00:12:36eine gewisse Abgrenzung dazwischen, wie automatisierungsvorwärts-Sachen wie N8N und Lovable, aber wir werden
00:12:40sie alle unter einem Dach bewerten, und also zuerst ist Lovable. Lovable. Wenn Sie mir diese
00:12:48Frage vor neun Monaten stellen würden, Lovable, hätte ich es in S-Tier gehabt, ich habe Lovable geliebt, als es
00:12:56herauskam, es nahm so ziemlich diese Basis von dem, was, was war es, 3.5 Sonnet zu der Zeit, Opus
00:13:023 zu der Zeit und stimmte es wirklich darauf ab, Ihnen ein großartiges Front-End-Design zu geben, und obwohl es irgendwie
00:13:08teuer war, schien es nicht verrückt. Nun, Lovable, es ist so: Was ist der Punkt? Was ist der Punkt? Ist
00:13:16Lovable in einem Jahr, zwei Jahren noch da? Wann würden Sie jemandem vorschlagen, Lovable zu verwenden
00:13:27wenn es keinen Punkt gibt? Es gibt keinen Punkt, wenn Codex existiert, wenn Claude Code existiert, wenn sogar einige der
00:13:33diese Chatbots existieren, zahlen Sie einen wahnsinnigen Aufpreis, um so etwas wie ein Ein-Klick-Superbase-
00:13:40Setup oder ein Ein-Klick-Deploy zu haben, und diese anderen Systeme sind so gut geworden, besonders Sachen wie
00:13:47Claude Code beim Erstellen von Front-End-Designs, die genauso gut sind wie das, was Lovable produziert, dass es
00:13:52ist wie: Worauf setzen Sie den Preis für Bequemlichkeit? Wie viel sind Sie bereit, pro
00:13:57Monat für Bequemlichkeit zu zahlen, denn es ist ein wahnsinniger Aufpreis, und ab einem gewissen Punkt spielt die Bequemlichkeit
00:14:01keine Rolle, denn wenn Sie eine echte App bauen, gibt es irgendeine Art von technischer Komplexität oder
00:14:06zumindest Straßensperren, die Sie navigieren müssen, egal was passiert, und wenn Sie das könnten, könnten Sie
00:14:11das in diesen, Sie könnten das in Anti-Gravity tun. Also ist Lovable keineswegs ein schlechtes Produkt, aber
00:14:17wenn Sie es mit der Konkurrenz und irgendwie dem Ökosystem im Großen und Ganzen vergleichen, ist es schwer, seine
00:14:23Existenz zu rechtfertigen. Ich meine, empfiehlt heutzutage irgendjemand Lovable? Ich tue es sicherlich nicht, und das gilt auch für
00:14:29Bolt, das ist an diesem Punkt nur eine weitere Version von Lovable. Erinnern Sie sich, als Bolt zum ersten Mal
00:14:33herauskam, es war irgendwie wild, wie, oh mein Gott, dieses Ding erstellt eine App von Grund auf, und was sind wir,
00:14:38anderthalb Jahre später, ich bin so: Ah, D-Tier, würde es niemals empfehlen. Sie sind so: Das ist ein toter
00:14:43Raum. Und wenn ich nicht Ihre Sachen wie Base 44 und diese Arten von Dingen habe, wie Replit,
00:14:49ich denke, da gehen sie auch hin. Ich habe sie nicht genug benutzt, um Ihnen eine großartige Antwort zu geben,
00:14:53aber wieder, ich denke, wenn Sie in die Zukunft blicken und sehen, dass Sie letztendlich konkurrieren
00:14:59gegen Claude Code und Codex und Anti-Gravity, werden sie nur benutzerfreundlicher werden. Ich meine,
00:15:05schauen Sie sich Sachen wie Co-Work an, es wird benutzerfreundlicher sein, und Sie, der kulturelle Zeitgeist
00:15:11hier ist: Claude, Claude, Claude, Claude. Wenn Sie Replit sind, wenn Sie Base 44 sind, sicherlich wenn Sie Bolt oder Lovable sind,
00:15:17welche Chance haben Sie langfristig? Ich glaube nicht, dass es gut aussieht. Nun, Cursor ist ein interessanter
00:15:22Fall, weil es in Kombination mit Claude Code und Codex verwendet werden kann, und ich habe das eine lange
00:15:27Zeit getan. Ich habe Cursor im Wesentlichen als meine IDE, als mein VS Code auf Steroiden benutzt, und habe Claude Code
00:15:34benutzt, und die Idee war: Okay, dass Claude Code 99% der Arbeit erledigen wird, aber wenn ich jemals querchecken will
00:15:39die Arbeit, nun, ich bin innerhalb von Cursor, also wissen Sie, ich könnte ein GPT 5.4 einen direkten Blick auf die
00:15:46Arbeit werfen lassen, die Claude Code erledigt hat, und sagen: Hey, das war gut, das war schlecht. Es war ein sehr einfach zu benutzendes zweites Paar Augen.
00:15:52Heutzutage, was brauchen wir das? Nun, erstens brauchen Sie es sicherlich nicht, weil ich Codex innerhalb
00:16:02von Claude Code verwenden kann. Es gibt ein Plugin, das wir verwenden können, und wir können es Code-Review, adversariales Code-Review
00:16:08durchführen lassen, also ist dieser spezielle Anwendungsfall vom Tisch. Lieben wir Composer 2.0? Ich, vielleicht tun Sie es, wenn das der
00:16:15Fall ist und Sie lieben Composer, vielleicht ist es A-Tier, vielleicht ist es irgendwie wie im Anti-Gravity-Raum, aber für
00:16:21mich heutzutage, würde ich sagen, es ist B-Tier. Es ist überhaupt kein schlechtes Produkt, verstehen Sie mich nicht falsch, ich sage nicht,
00:16:25dass Sie Cursor nicht verwenden sollten. Ich denke, es ist ein großartiges Produkt, es ist nur wieder, wer ist der Cursor-
00:16:30Kunde und warum wählen sie Cursor gegenüber diesen anderen Typen? Ich, ich denke, es ist eine Stufe
00:16:37entfernt von diesem ganzen Lovable-Problem, und ich hätte wahrscheinlich über diese Typen
00:16:41im letzten Abschnitt sprechen sollen, aber Gemini CLI, nennen Sie 10 Leute, die Gemini CLI verwenden, die nicht für Google arbeiten.
00:16:47Verstanden. Ich denke, ich durch die Tatsache, dass es buchstäblich von der Diskussion abwesend ist, und wieder: Benutzt das
00:16:55tatsächlich jemand? Wenn die Antwort nein ist, gibt es wahrscheinlich einen Grund dafür. Ich, ich weiß buchstäblich nicht
00:16:59von einer einzigen Person, die Gemini CLI verwendet oder angegeben hat, dass sie es verwendet, die nicht buchstäblich ein
00:17:04Google-Mitarbeiter ist, und ich denke, das spricht Bände. Nun, wie steht es mit N8N? Oh, ich war lange Zeit ein Super-N8N-Fanboy,
00:17:11also war das eine lange, lange Zeit automatisch S-Tier. Heutzutage ging N8N von: Dies ist
00:17:18das Go-to-Tool, das Sie verwenden sollten, um KI-Agenten und Automatisierungen ohne Code zu erstellen, zu einem sehr Nischen-
00:17:26Tool, denn seien wir ehrlich: alles, was N8N tun kann, kann Claude Code tun, alles, was N8N tun kann, kann Codex
00:17:33tun, und wenn Sie ein Tool sind, bei dem ich sagen kann: Alles, was Sie tun, kann Claude Code oder Codex besser tun, dann sollte es einen
00:17:40sehr überzeugenden Grund oder ein überzeugendes Unterscheidungsmerkmal geben, ob das Benutzerfreundlichkeit, Kosten, Nische ist, um
00:17:48Ihre Existenz zu rechtfertigen. Für N8N hat das immer noch das, und ich denke, es ist Nische und Benutzerfreundlichkeit, aber ich, also benutze ich
00:17:55N8N heutzutage nur für Kundenprojekte, wenn es ein Kundenprojekt für ein sehr nicht-technisches Team ist, wo
00:18:01aus welchem Grund auch immer sie auch praktisch sein müssen, also werden sie irgendwann die Fähigkeit brauchen,
00:18:06in die Automatisierung zu gehen und vielleicht eine oder zwei Dinge zu optimieren. N8N macht das sehr einfach zu tun, die
00:18:11visuelle Einrichtung ist großartig, aber ich meine, wieder, die Benutzerfreundlichkeit wird jetzt zum Unterscheidungsmerkmal von N8N. Es ist nicht
00:18:19weil es irgendwie schneller ist als Claude Code. Ich kann hochfahren, ich kann hochfahren und ich kann
00:18:27N8N-Automatisierungen schneller innerhalb von Claude Code erstellen, als ich das durch N8N selbst tun kann, das ist irgendwie ein
00:18:32Problem für die langfristige Lebensfähigkeit, denke ich. Ich meine, also ging es von, denke ich, irgendwie allgegenwärtig in diesem
00:18:39No-Code-KI-Raum zu: vielleicht, wenn Sie es aus einem bestimmten Grund brauchen und Sie eine Rechtfertigung brauchen,
00:18:45um das zu tun, aber das Produkt selbst hat sich nicht geändert. Es tut immer noch, was es tut, sehr gut, aber N8Ns
00:18:50direkte Konkurrenz, wie Make und Zapier, D-Tier: teurer, weniger Flexibilität, warum sich die Mühe machen? Also wieder,
00:19:00was ist Ihr Unterscheidungsmerkmal? Wenn Sie das nicht tun können, werden Sie sterben, also weiß ich nicht, warum irgendjemand
00:19:04überlassen wir das den Nachzüglern.
00:19:09Wo ordnen wir NotebookLM ein? Es ist irgendwie ein
00:19:15Nischen-KI-Tool. Es ist kein Coding-Agent, kein reines
00:19:20No-Code-Tool, obwohl man argumentieren könnte, dass
00:19:25es eines ist. Wenn ich ihm einen Prompt und Kontext gebe, erstellt es Dinge für mich. Wie auch
00:19:33immer, NotebookLM ist fantastisch und definitiv S-Tier für ein einzelnes KI-Tool. Ich halte
00:19:38NotebookLM für das beste Produkt von Google, ehrlich gesagt. Und die Tatsache, dass ich es
00:19:43in Claude Code integrieren kann oder mit Anti-Gravity unter Verwendung von Tools wie dem
00:19:50NotebookLM PI CLI, ist ein enormer Produktivitätsschub. Und Google lässt einen so viel
00:19:55davon kostenlos nutzen, was verrückt ist. Man kann damit wirklich gute Ergebnisse erzielen,
00:20:01wie Foliensätze, Infografiken, und es ist meiner Meinung nach der beste Weg für jede Art von
00:20:07Recherche, die viele YouTube-Videos beinhaltet. Ich habe eine Menge Inhalte über die
00:20:13Kombination von Claude Code und NotebookLM gemacht, und zwar aus gutem Grund, denn
00:20:20NotebookLM ist großartig und kostenlos. Ein weiteres Tool, über das wir nicht gesprochen
00:20:26haben, das wir aber vielleicht bei den Chatbots hätten erwähnen sollen, ist Perplexity. Nun,
00:20:34ist Perplexity ein Chatbot? Nutzt jemand Perplexity als seinen einzigen eigenständigen
00:20:40Chatbot? Vielleicht. Das Argument bei Perplexity ist heutzutage, dass es der Chatbot ist,
00:20:47der einen eine Reihe anderer Chatbots nutzen lässt. Aber lange Zeit war es für mich S-Tier.
00:20:53Und wieder, wie so viele Tools, beginnt es heutzutage abzufallen. Ich würde Perplexity
00:20:58in die C-Tier einordnen. Und vielleicht liegt das zu einem großen Teil daran, dass ich
00:21:03Perplexity's Peripherie-Tools wie Pages oder deren Browser nicht nutze. Und deshalb
00:21:10nutze ich Perplexity wirklich nur, und ich habe den Pro-Plan, wenn ich sage: "Alles klar,
00:21:16ich möchte einfach Informationen über etwas, das heute passiert ist, und ich möchte die
00:21:22Quellen dazu". Und ich möchte nicht explizit Claude oder ChatGPT dazu auffordern müssen,
00:21:28eine Websuche durchzuführen, um diese echten Daten zu bekommen. In gewissem Sinne ist
00:21:33es fast wie Grok auf Steroiden, wo es wirklich gut darin ist, Web-Daten abzurufen, und es
00:21:42ist dafür gebaut. Aber noch einmal: Ist es ein täglicher Begleiter? Nein. Ist es wert,
00:21:49dafür 20 Dollar im Monat zusätzlich zu all diesen anderen Tools zu zahlen? Nein. Es ist ein
00:21:55"Nice-to-have". Und in unserer letzten Kategorie sprechen wir über einige dieser
00:22:00Content-Creation-Tools, Bildgeneratoren, Videogeneratoren und so weiter. Nun,
00:22:05zuerst auf der Liste ist ein aktuelles Produkt, und das ist Design von Claude. Im luftleeren
00:22:12Ich denke also, am Ende des Tages ist es eine B-Note, wir teilen das einfach mal auf: großartiges Tool, sobald
00:22:18eine Tonne benutzt, und es ist ein riesiger Schritt nach vorne gegenüber dem normalen
00:22:23Claude Code und auch ein großer Fortschritt gegenüber den meisten Skills, die man da draußen
00:22:26sieht. Dinge wie – nun, sicherlich der Frontend-Design-Skill, der UI/UX-Pro-Skill,
00:22:32stellt es in den Schatten, und direkt von Anfang an macht es einen großartigen Job,
00:22:39indem es dir ermöglicht, sehr schnell eine Reihe von Visuals zu iterieren. Jedoch, Komma,
00:22:50die Nutzung ist das Schlimmste, was ich je in meinem Leben gesehen habe. Man verbrennt
00:22:55Tokens mit einer verrückten Rate. Ich bekomme keine zusätzliche Nutzung, obwohl ich 200
00:23:00Dollar im Monat bezahle. Ich habe die gleiche Nutzung wie jemand auf Pro. Warum? Und es
00:23:06ist überhaupt nicht klar, was das alles auffrisst, obwohl es nach einigem Experimentieren,
00:23:11nachdem man alles verbraucht hat, sehr offensichtlich wird. Ein Design-System zu erstellen
00:23:21kann 30 Prozent deiner Tokens kosten. Nach einer einfachen Landingpage zu fragen, kann
00:23:26etwa fünf Prozent deiner Tokens verbrauchen. Die Nutzung ist also schwierig. Im luftleeren
00:23:33Raum S-Tier, in der Nutzung D-Tier. Also denke ich, am Ende des Tages ist ein B-Tier ein
00:23:40guter Kompromiss. Großartiges Tool, sobald sie die Nutzung im Griff haben, wird es
00:23:47erstaunlich sein, eines der besten Produkte, um ehrlich zu sein, aber momentan ist es für
00:23:53die durchschnittliche Person nicht wirklich nutzbar. Ich verbrauche bereits extra Tokens
00:23:59dafür. Oh ja, Copilot. Ich habe nicht einmal Copilot erwähnt. Ich habe vergessen, dass dieses
00:24:04Ding überhaupt dabei war, spricht wahrscheinlich für sich selbst. Copilot benutzt man, wenn
00:24:11man dazu gezwungen wird. Niemand benutzt das von sich aus. Es gibt einige Argumente, dass es
00:24:20anständig ist, so okay, es ist in das Unternehmen selbst integriert. Also die C-Tier, ich
00:24:28gebe ihm C-Minus-Tier. Ich weiß nicht, die Tatsache, dass ich es sogar vergessen habe zu
00:24:34erwähnen, sagt wahrscheinlich schon viel aus. Nun, Kling 3.0. Wenn ihr nicht wisst, was
00:24:42Kling 3.0 ist: Es ist ein Videomodell und es ist ein solides A-Tier, wirklich gute Sachen.
00:24:49Die direkte Konkurrenz ist Veo 3, nun, Veo 3.1 heutzutage, das ich in die B-Tier einordnen
00:24:56würde. Es veraltet zu diesem Zeitpunkt irgendwie und es ist sehr teuer, was die andere Sache
00:25:01ist. Und dann haben wir SeaDance 2.0. Wenn ihr in letzter Zeit irgendein KI-Video gesehen
00:25:09habt, war es SeaDance. Erinnert ihr euch an all diese Videos vor einem Monat, als es die
00:25:15eingebettete Beta von all den Dingen wie Schauspielern und Filmszenen war, die nachgestellt
00:25:20wurden? Das war SeaDance. Und SeaDance ist großartig, definitiv ein Schritt nach vorne
00:25:24gegenüber Veo und Kling. Die Visuals sind wild, es ist wild und überraschend nicht so
00:25:30teuer im Vergleich. Und dann haben wir unsere Bildmodelle. Nano Banana Pro ist S-Tier, es
00:25:36ist schon seit einiger Zeit erstklassig. Und dann haben wir auch das brandneue Image Gen 2
00:25:40von GPT. Nun, nach dem Wenigen, was ich damit gespielt habe, und das kam gerade erst heraus,
00:25:47würde ich es S-Tier nennen, aber ich habe es nicht genug benutzt und nicht genug Edge Cases
00:25:53gesehen. Das ist also eines dieser Szenarien, wo man sagt, wenn man davon überzeugt ist, S-Tier.
00:25:59Wenn man abwarten will, ist es zumindest A-Tier. Also halten wir es vorerst in der A-Tier,
00:26:05wir werden sehen, wie es sich hält. Aber das gesagt, ein großartiges Bildmodell ist ein großer
00:26:10Vorteil für ChatGPT, weil Tonnen von Menschen das benutzen. Tonnen von Menschen nutzen Image Gen.
00:26:15Und einer der großen Unterscheidungsmerkmale für Gemini gegenüber ChatGPT waren schon immer
00:26:20seine überlegenen Bildmodelle. Also, hier sind wir gelandet. Ich hoffe, das wirft etwas Licht
00:26:25darauf, worauf ihr euch konzentrieren solltet und was eure Zeit nicht wirklich wert ist. Und
00:26:31hoffentlich brachte es sogar einige neue KI-Tools zur Sprache, von denen ihr noch nie gehört

Key Takeaway

Für professionelle Anwendungsfälle und Coding-Projekte sind spezialisierte Coding-Agenten wie Claude Code oder Codex das Maß der Dinge, während Gemini 3.1 das beste ganzheitliche Preis-Leistungs-Verhältnis für den täglichen Chatbot-Gebrauch bietet.

Highlights

Gemini 3.1 ist der beste tägliche KI-Chatbot für 20 Dollar pro Monat, da es im Gegensatz zur Konkurrenz Videoinhalte wie YouTube-Videos und TikToks nativ analysieren kann.

Claude Code ist der Industriestandard für Coding-Agenten, wobei Nutzer bei einem 100- bis 200-Dollar-Monatsplan eine 90-prozentige Reduzierung der Token-Kosten gegenüber Opus 4.7-API-Direktabrufen erzielen.

OpenClaw und Hermes werden als Produktivitätstheater eingestuft, da alle ihre Funktionen effizienter innerhalb von Claude Code oder Codex ausgeführt werden können.

Lovable und Bolt verlieren als No-Code-Builder langfristig an Bedeutung, da allgemeine Coding-Agenten wie Codex und Claude Code mittlerweile Front-End-Designs in vergleichbarer Qualität liefern.

NotebookLM ist das leistungsfähigste kostenlose KI-Tool für Recherchen und die Erstellung von Foliensätzen oder Infografiken aus YouTube-Inhalten.

Design von Claude ermöglicht eine schnelle Iteration von Visuals, hat jedoch in der aktuellen Version eine so hohe Token-Verbrauchsrate, dass es für die meisten Nutzer unpraktisch ist.

SeaDance 2.0 führt den Videogenerierungsmarkt an und bietet eine deutlich höhere visuelle Qualität als Veo 3.1 oder Kling 3.0.

Timeline

KI-Chatbots im Vergleich

  • ChatGPT fungiert als solider Durchschnittschatbot, der vor allem durch seine Bildgenerierung Extras bietet.
  • Gemini 3.1 ist die beste Wahl für den täglichen Begleiter aufgrund seiner Fähigkeit zur Videoanalyse und Bildgenerierung für 20 Dollar.
  • Claude (Opus 4.7) bietet hohe Qualität, wird aber bei einem 20-Dollar-Plan durch strikte Nutzungseinschränkungen behindert.
  • Grok ist primär für Twitter-affine Nutzer nützlich, bietet jedoch schlechtere Coding- und Videofunktionen als die Konkurrenz.

Die Bewertung der Chatbots erfolgt auf Basis von täglicher Nutzbarkeit und Leistungsfähigkeit. Während ChatGPT das Standard-Modell 5.4 nutzt, punktet Gemini 3.1 mit multimodalen Fähigkeiten, die besonders die Videoanalyse von sozialen Medien umfassen. Claude überzeugt zwar durch das leistungsstarke Opus 4.7-Modell, ist für den durchschnittlichen Nutzer jedoch aufgrund starker Drosselung bei Einsteigerplänen eher ein C-Tier-Produkt.

Coding-Agenten und Harnesses

  • Claude Code ist aufgrund seiner Effizienz und breiten Anwendung der Industriestandard für KI-Entwickler.
  • OpenAI Codex bietet als Alternative eine ähnliche Leistung wie Claude Code, ermöglicht jedoch eine höhere Token-Ausnutzung.
  • OpenClaw und Hermes werden als ineffizientes Produktivitätstheater bewertet, da sie lediglich oberflächliche Fortschritte simulieren.
  • Anti-Gravity wurde vom S-Tier in das A-Tier herabgestuft, da native Lösungen mittlerweile eine höhere Flexibilität bieten.

Coding-Agenten stehen im Mittelpunkt der modernen Entwicklung. Claude Code und Codex sind die primären Werkzeuge, wobei die Wahl zwischen ihnen oft von persönlichen Präferenzen abhängt. Werkzeuge wie OpenClaw oder Hermes simulieren zwar Aktivität durch Dashboards und automatische Skill-Updates, bieten jedoch keinen tatsächlichen Mehrwert gegenüber der direkten Nutzung von Claude Code oder Codex.

No-Code-Builder und Produktivitäts-Tools

  • Lovable und Bolt haben ihre Existenzberechtigung verloren, da Coding-Agenten mittlerweile gleichwertige Front-End-Ergebnisse liefern.
  • Cursor wird als B-Tier-Produkt eingestuft, da seine ursprüngliche Rolle als Kontrollinstanz durch Plugins in Claude Code obsolet wurde.
  • N8N ist nur noch für spezifische Nischenprojekte in nicht-technischen Teams relevant, da Coding-Agenten Automatisierungen mittlerweile schneller erstellen.

Der Bereich No-Code-Builder steht unter massivem Druck durch Coding-Agenten. Da Systeme wie Claude Code mittlerweile komplexe Front-Ends in professioneller Qualität erstellen, rechtfertigen die hohen Aufpreise für Tools wie Lovable oder Bolt nicht länger den Komfortgewinn. N8N bleibt ein starkes Tool für einfache Automatisierungen, verliert aber an Bedeutung, da die gleichen Abläufe durch Coding-Agenten effizienter und kostengünstiger realisiert werden.

Spezial- und Content-Erstellungs-Tools

  • NotebookLM gilt als bestes Google-Produkt für Rechercheaufgaben und die Aufbereitung von YouTube-Inhalten.
  • Perplexity ist ein nützliches Zusatztool zur Web-Recherche, eignet sich aber nicht als täglicher Standard-Chatbot.
  • Design von Claude bietet beeindruckende visuelle Iterationen, leidet jedoch unter einem exzessiven Token-Verbrauch bei Design-Systemen.
  • SeaDance 2.0 ist derzeit das führende Modell für KI-Video, während Nano Banana Pro weiterhin S-Tier für Bildgenerierung bleibt.

In der abschließenden Kategorie sticht NotebookLM durch seine kostenlose und leistungsstarke Recherchefunktion hervor. Tools zur Content-Erstellung wie Design von Claude zeigen zwar hohes Potenzial bei der UI/UX-Gestaltung, sind aber aufgrund der hohen Token-Kosten momentan für den Alltagsgebrauch nur eingeschränkt zu empfehlen. Videogeneratoren wie SeaDance 2.0 setzen neue Standards in der visuellen Qualität.

Community Posts

View all posts