Log in to leave a comment
No posts yet
cache_control: {"type": "ephemeral"}.\n * Dynamische Daten nach unten: Variablen, die sich bei jedem Aufruf ändern (wie Fragen, User-IDs oder die aktuelle Uhrzeit), müssen zwingend nach dem Cache-Marker, also ganz unten im Prompt, stehen.\n\nKosten von 0,06 – also auf ein Zehntel. Für Dienste, die mit großen Dokumentmengen arbeiten, verändert dies die gesamte Gewinnstruktur.\n\n-----\n\n## Chain of Draft (CoD) zur Vermeidung ausschweifender Argumentation\n\nWenn Sie das Modell anweisen, bei komplexen Problemen „Schritt für Schritt zu denken“ (Chain of Thought, CoT), produziert es oft langatmige Prozesse wie in einem Tagebuch. Das alles kostet Geld. Die Alternative ist CoD (Chain of Draft). Weisen Sie das Modell an, Überlegungen kurz wie Notizen in maximal 5 Wörtern festzuhalten.\nIn mathematischen Tests lieferte CoD die gleiche korrekte Antwort mit nur 31,3 Token, während CoT 172,5 Token verbrauchte.\n\n### Anwendung von CoD\n\n * Entwurfsmodus aktivieren: Legen Sie im System-Prompt fest: „Notiere die Gedanken zu jedem Schritt in Entwurfsform mit maximal 5 Wörtern.“\n * Quellen angeben: Falls Sie Halluzinationen befürchten, fügen Sie eine minimale Validierungsbedingung hinzu: „Geben Sie Belegstellen in -Tags an.“\n * Ausnahmeregelungen: Erlauben Sie detaillierte Beschreibungen nur in wirklich komplexen Grenzfällen, um einen Qualitätsabfall zu verhindern.\n\nSo behalten Sie die Genauigkeit bei, während Sie bis zu 92 % der Output-Token einsparen. Auch die Latenz der Antwort halbiert sich.\n\n-----\n\n## Echtzeit-Kostenmonitoring und Gewinnanalyse\n\nAll diese Optimierungen sind nur sinnvoll, wenn sie messbar sind. Ein Onlineshop mit 300.000 Aufrufen pro Monat kann seine Kosten durch die Kombination von Prompt-Caching und CoD von 4.500 senken. Das bedeutet einen monatlichen operativen Gewinn von etwa 5 Millionen KRW durch nur wenige Zeilen Prompt-Anpassung.\n\n### Nachsorge\n\n * Tool-Integration: Nutzen Sie Helicone oder Langfuse, um visuell zu verfolgen, wie oft Ihr Cache tatsächlich greift und wo Kosten entstehen.\n * Automatischer Ausschluss: Erstellen Sie in der Entwicklungsumgebung eine .claudeignore-Datei, um zu verhindern, dass unnötige Dateien in den Kontext gelangen.\n * Gewinnberechnung: Nutzen Sie die Formel $Cost = N imes (T_{in} imes P_{in} + T_{out} imes P_{out})$ in einer Tabelle, um die Performance wöchentlich zu prüfen.\n\nLöschen Sie noch heute das „Danke“ aus Ihren System-Prompts und ändern Sie die Reihenfolge Ihrer Daten. Diese kleine Mühe verwandelt Ihre monatliche Rechnung in Profit.