Log in to leave a comment
No posts yet
Claude 3.5 Sonnet es un modelo programado para ser amable. Si simplemente le pide que sea breve, desperdiciará tokens por pura cortesía. El modelo se enfoca más en el principio y el final del prompt. Aproveche esta característica: asigne la personalidad de "ingeniero cavernícola" en la parte superior del mensaje del sistema y, en la parte inferior, prohíba explícitamente los saludos y los resúmenes. Solo con enfatizar las instrucciones al final una vez más, puede ahorrar de inmediato un 30% en los costos de tokens por cada llamada a la API.
Reducir la salida no significa que deba disminuir la inteligencia del modelo. Al escribir código con lógica compleja, utilice la etiqueta <thinking>. Haga que el proceso de razonamiento se realice detalladamente dentro de etiquetas internas y aplique el estilo "Caveman" solo en la etiqueta <answer>, que contiene el resultado final. A partir de 2026, Claude 4.6 Sonnet muestra una alta tasa de éxito con un costo de aproximadamente el 30% en comparación con el modelo Opus. Si procesa el proceso de pensamiento de manera económica mediante tokens de caché y concentra los costosos tokens de salida solo en el código principal, logrará precisión y economía simultáneamente.
Cuando se le pide que hable como un cavernícola, a veces rompe la sintaxis JSON o uomite sentencias de importación esenciales. Para un desarrollador independiente, estos errores de parsing generan el costo de la corrección manual. Fuerce el uso de delimitadores como ---BEGIN JSON--- en el prompt del sistema e incluya un script de post-procesamiento en su pipeline que use el módulo re de Python para limpiar las cercas de código de Markdown. Con este único guardarraíl, se bloquea más del 90% de la intervención manual en el proceso de automatización.
En 2026, el precio de los tokens de salida de Claude 3.5 Sonnet es de 15,00 USD por cada millón de tokens. Es 5 veces más caro que la entrada. Un desarrollador que realiza 100 solicitudes de codificación al día puede reducir su costo mensual de 54 USD a unos 31 USD aplicando el modo Caveman. Ajuste la intensidad según la naturaleza de la tarea: use el modo Lite para correcciones simples y el modo Ultra para conversiones masivas de datos, dividiendo las plantillas. Invertir solo 15 minutos en modificar sus prompts le ahorrará 276 USD al año. Un ingeniero eficiente no mantiene conversaciones largas con la IA; simplemente extrae la densidad de información necesaria con exactitud.