Log in to leave a comment
No posts yet
Browser-Automatisierung ist ein wesentlicher Bestandteil der modernen Entwicklung, aber sobald man AI-Agenten ins Spiel bringt, wird die Situation komplex. Jeder Entwickler, der bereits mit bestehenden Playwright- oder Puppeteer-MCPs (Model Context Protocol) gearbeitet hat, wird es kennen: Ein aufgeblähter Kontext, unordentliche Ordnerstrukturen und eine niedrige Erfolgsrate, bei der die Arbeit im entscheidenden Moment abbricht, stellen die Geduld auf die Probe.
Das größte Problem ist die Effizienz. Herkömmliche Open-Source-MCP-Methoden verbrauchen bei jeder Sitzungsinitialisierung 13.700 bis 19.000 Token, nur um den Browserstatus an das Modell zu übermitteln. Man verbraucht also die Ressourcen, die eigentlich für die Inferenz gedacht sind, bereits für die Umgebungskonfiguration. Im Gegensatz dazu greift die Claude Code Chrome-Erweiterung direkt auf die internen APIs des Browsers zu. Da sie die tatsächliche Benutzersitzung teilt, werden klassische Debugging-Probleme nach dem Motto „Auf meinem Rechner funktioniert es, nur bei der KI nicht“ von vornherein ausgeschlossen.
Der Erfolg oder Misserfolg von KI-Tests hängt davon ab, wie präzise die Informationen übermittelt werden. Es müssen drei praktische Strategien angewendet werden, um unnötige Daten zu eliminieren und die Effizienz zu maximieren.
Traditionelle Automatisierungstools fixieren sich auf den Text von DOM-Elementen. Für ein Modell mit so starken Vision-Fähigkeiten wie Claude ist jedoch ein Screenshot der gesamten Seite viel effektiver. Ein Bild von etwa 500 KB weist eine höhere Informationsdichte auf, als zehntausende Zeilen HTML-Code als Text zu serialisieren und zu versenden. Dadurch lassen sich visuelle Regressionen wie Überlagerungen von Elementen oder Fehler im responsiven Layout auf einen Schlag erfassen.
Cookie-Banner oder Newsletter-Popups sind die Hauptschuldigen, die den Fluss der KI unterbrechen. Lassen Sie die KI nicht ihre wertvollen Token verschwenden, um Popups zu schließen. Definieren Sie ein Vorab-Skript in der Datei CLAUDE.md, um Elemente mit [aria-modal="true"] oder Cookie-bezogenen Attributen zwangsweise auszublenden. Laut aktuellen Forschungsdaten kann allein dieser Vorverarbeitungsschritt die Wahrscheinlichkeit von Testfehlern um mehr als 25% senken.
Lassen Sie die KI nicht wahllos das gesamte HTML lesen, sondern weisen Sie sie an, spezifische Elemente präzise anzuvisieren. Die Prioritäten liegen wie folgt:
[data-testid="submit-btn"].[aria-label="Anmelden"].Die Manifest V3-Spezifikation von Chrome beendet Background Service Worker, wenn sie etwa 30 Sekunden lang im Leerlauf sind. Dies ist der Punkt, an dem bei langwierigen E2E-Tests die sogenannte 30-Sekunden-Mauer auftritt, bei der die KI den Browserstatus verliert.
Um dies zu lösen, ist ein modulares Testdesign unerlässlich, bei dem große Szenarien nicht als Ganzes ausgeführt, sondern in kleine, unabhängig verifizierbare Einheiten unterteilt werden. Erstellen Sie eine separate Datei wie tasks/status.md, um den Testfortschritt in Echtzeit zu protokollieren. Selbst wenn die Sitzung unterbrochen wird, liest die KI dieses Protokoll und setzt die Arbeit sofort an der Stelle fort, an der sie abgebrochen wurde. Zudem ist ein Heartbeat-Trick nützlich, bei dem alle 25 Sekunden eine leichte API aufgerufen wird, um den Leerlauf-Timer zwangsweise zurückzusetzen.
Vergessen Sie beim Aufbau der tatsächlichen Umgebung über die Theorie hinaus die folgenden Details nicht:
--user-data-dir, um ein dediziertes Chrome-Profil für Tests zu erstellen. Dies verhindert Konflikte mit persönlichen Sitzungen und hält den erforderlichen Login-Status stabil.Die Kombination aus Claude Code und der Chrome-Erweiterung zeigt, dass die KI von einem bloßen Beobachter zu einem echten Akteur gereift ist. Wenn man den Overhead herkömmlicher MCP-Methoden reduziert und die Einschränkungen von Manifest V3 durch cleveres Design umgeht, muss man keine Zeit mehr mit monotonen manuellen Tests verschwenden.
Letztlich bedeutet erfolgreiches KI-Testing eine grundlegende Umstellung hin zum Evaluation Driven Development, die über rein technische Einstellungen hinausgeht. Führen Sie jetzt optimierte Anweisungen in Ihrem Projekt-Root ein, um eine Automatisierungsumgebung zu schaffen, die die Softwarequalität fundamental verbessert.