Log in to leave a comment
No posts yet
Ao iniciar a codificação baseada em agentes, o que mais assusta não é o desempenho, mas a fatura do cartão de crédito do próximo mês. Os agentes duplos que vemos em vídeos são fantásticos, mas usá-los sem critério é a receita perfeita para uma bomba de custos de API. Em 2026, o preço de entrada do Claude 4.6 Opus é de 3.00). O custo de saída chega a saltar para $25.00. Em um projeto legado com mais de 100 mil tokens, cada vez que um loop é executado, é como se o valor de uma xícara de café fosse jogado fora.
Para controlar os custos, não insista apenas no Opus; utilize um método de alocação de slots. Aloque o Opus apenas para design e decisões de arquitetura, que representam 20% do trabalho total, e deixe os 80% restantes de implementação simples para o Sonnet.
--model opus apenas em sessões onde a lógica complexa estiver emaranhada. É necessário criar o hábito de abrir o relatório da API toda segunda-feira de manhã para verificar se os gastos reais estão seguindo a curva esperada.Na verdade, 70% dos tokens usados pelos agentes são desperdiçados vasculhando arquivos desnecessários e explorando diretórios. Os LLMs apresentam um fenômeno de "queda de desempenho" (performance cliff), onde o foco diminui drasticamente quando o contexto ultrapassa 100 mil tokens. Inserir todo o código-fonte de uma vez é o caminho mais curto para desperdiçar dinheiro e arruinar a performance. Testes internos da Anthropic mostram que, ao entregar o contexto de forma compactada, a qualidade do raciocínio é mantida enquanto os custos de entrada são reduzidos em mais de 50%.
Crie um arquivo ARCH.md, que serve como uma especificação dedicada para a IA, e dê o mapa ao agente.
tree -L 3 -I 'node_modules|dist|.git' > tree.md. Em seguida, use ferramentas como o Repomix para criar um mapa de assinaturas, removendo a lógica real e deixando apenas as assinaturas de funções e definições de interfaces. Por fim, liste claramente assets como .svg e .json no arquivo .claudeignore para removê-los da visão do agente.O cerne do agente duplo é separar o design (Advisor) da implementação (Executor) para criar uma trava de segurança. Se você simplesmente pedir "revise o código", receberá apenas respostas sem alma como "está limpo". Como engenheiro sênior, você deve forçar o Advisor a assumir o papel de um crítico ranzinza. Passar por essa etapa adequadamente pode reduzir drasticamente o tempo gasto corrigindo bugs a posteriori, que costumava levar mais de 5 horas semanais.
Antes que o modelo de execução toque no código, crie um dispositivo que obrigue o Opus a fazer uma revisão crítica.
Se você colocar o Advisor e o Executor em uma única fila, haverá tempo de espera toda vez que houver uma validação. Em refatorações de grande escala que exigem a alteração de centenas de arquivos, este método é muito lento. Ao migrar bibliotecas de mais de 50 mil linhas, é necessária uma orquestração que divida o trabalho e o execute em paralelo.
O processo paralelo para acelerar o trabalho é estruturado da seguinte forma:
git worktree add. Inicie sessões separadas do Claude Code em cada worktree para refatorar diferentes módulos simultaneamente. Por fim, use ferramentas como o Clash para resolver conflitos entre as worktrees e mesclá-las no branch principal.À medida que o código escrito por IA se acumula, surge um momento em que a estrutura geral se torna uma bagunça, gerando dívida técnica. O agente corrige um arquivo individual de forma brilhante, mas não se responsabiliza pela direção que o sistema como um todo deve seguir. O verdadeiro trabalho de um engenheiro sênior em 2026 não é digitar o código manualmente, mas gerenciar o estado de alinhamento dos resultados produzidos pelos agentes.
Antes de encerrar o expediente toda sexta-feira, execute uma rotina de 'Auditoria de Arquitetura'.