Log in to leave a comment
No posts yet
cache_control: {"type": "ephemeral"} para declarar o ponto de cache.\n * Dados dinâmicos no final: Variáveis que mudam a cada vez, como o conteúdo da pergunta, ID do usuário ou hora atual, devem obrigatoriamente ficar após o marcador de cache, ou seja, na base do prompt.\n\nO custo, que era de 0,006) ao atingir o cache. Para serviços que lidam com grandes volumes de documentos, este é o ponto onde a própria estrutura de lucro muda.\n\n-----\n\n## Chain of Draft (CoD) para evitar raciocínios prolixos\n\nAo pedir para “pensar passo a passo (CoT)” para resolver problemas complexos, o modelo despeja processos longos como se estivesse escrevendo um diário. Tudo isso é custo. A alternativa é o CoD (Chain of Draft). Instrua o modelo a raciocinar de forma curta, como notas de rascunho, usando no máximo 5 palavras.\n\n### Como aplicar o CoD\n\n * Ativar modo rascunho: Especifique no prompt do sistema: “Registre o pensamento de cada etapa em formato de rascunho com menos de 5 palavras”.\n * Especificar fontes: Se estiver preocupado com alucinações, adicione uma condição mínima de verificação como “Indique o trecho base com a tag ”.\n * Cláusula de exceção: Evite a queda de qualidade deixando uma saída que permita descrições detalhadas apenas em casos realmente complexos.\n\nMantendo a precisão, você pode economizar até 92% dos tokens de saída. O tempo de latência da resposta também cai pela metade.\n\n-----\n\n## Monitoramento de custos em tempo real e análise de lucro\n\nToda essa otimização só faz sentido se for visível. Um serviço de e-commerce com 300.000 chamadas mensais pode ver seus custos caírem de $4.500 para $660 ao combinar Prompt Caching e CoD. É como se um lucro operacional de cerca de 5 milhões de won por mês surgisse apenas com algumas linhas de modificação de prompt..claudeignore para evitar que arquivos desnecessários sejam incluídos no contexto.$Cost = N \times (T_{in} \times P_{in} + T_{out} \times P_{out})$ em uma planilha e monitore o desempenho semanalmente.\n\nApague o “obrigado” do seu prompt de sistema e mude a ordem dos dados hoje mesmo. Esse pequeno incômodo transforma sua fatura mensal em lucro.