00:00:00A Anthropic acaba de lançar a estratégia de consultor,
00:00:02que nos permite não apenas obter um melhor desempenho
00:00:05de nossos modelos Anthropic, mas fazê-lo a um custo menor.
00:00:09E a maneira como funciona é bem simples.
00:00:10Ela combina o Opus como um consultor
00:00:12com o Sonnet ou Haiku como executor.
00:00:15Assim, o Opus cria um plano
00:00:17e o modelo mais barato faz todo o trabalho.
00:00:19Isso é muito semelhante a quando usamos o Claude Code
00:00:22e fazemos o Opus rodar o modo de planejamento,
00:00:24mas passamos a execução real para o Sonnet.
00:00:27A diferença é que, com a estratégia de consultor,
00:00:30isso tudo é feito automaticamente via API.
00:00:32Portanto, isso é perfeito se você estiver trabalhando em algo
00:00:34fora do Claude Code.
00:00:35Se você tem qualquer tipo de aplicação web
00:00:38que usa APIs da Anthropic nos bastidores,
00:00:41isso é uma escolha óbvia.
00:00:42Você obterá resultados mais eficazes por um preço menor.
00:00:46E na verdade é um pouco mais sofisticado
00:00:48do que fazemos no Claude Code com o Opus planejando
00:00:50e depois o Sonnet executando.
00:00:52Porque esta relação consultor-executor
00:00:55está constantemente em fluxo e não é algo único
00:00:58onde o Opus aconselha uma vez e o Sonnet executa.
00:01:01Na verdade, há um vai e vem.
00:01:02Como diz aqui, quando o executor,
00:01:04ou seja, o Sonnet ou Haiku, encontra uma decisão
00:01:06que não consegue resolver razoavelmente,
00:01:08ele consulta o Opus para orientação como consultor.
00:01:11O Opus tem todo o contexto do que o Sonnet está fazendo.
00:01:15E por isso não é apenas como o modo de plano,
00:01:16onde ele dá uma estratégia e pronto.
00:01:19É como se o Sonnet tentasse executar,
00:01:22encontrasse um obstáculo e voltasse para o Opus.
00:01:24Portanto, há um vai e vem constante.
00:01:26Além disso, para manter os custos baixos,
00:01:28o Opus não faz chamadas de ferramentas em nenhum momento.
00:01:30As únicas chamadas de ferramentas são feitas por aquele LLM menor,
00:01:34neste caso, o Sonnet ou o Haiku.
00:01:35Mas o Opus retém todo o contexto compartilhado.
00:01:39E, como mencionei na introdução,
00:01:40isso nos dá melhores resultados por menos.
00:01:43Aqui, está comparando o Sonnet 3.5 com
00:01:46o consultor Opus versus o Sonnet 3.5 sozinho.
00:01:50O Sonnet pontuou mais no SWE-bench com 74,8 contra 72,1,
00:01:55e saiu mais barato.
00:01:56Custou pouco mais de 96 centavos por tarefa de agente
00:02:00contra quase 1 dólar e 9 centavos, o que é significativo.
00:02:03E você vê a mesma coisa acontecer em outros benchmarks
00:02:06como BrowseComp e TerminalBench.
00:02:0860,4 contra 58,1, e é mais barato.
00:02:12O fato de ser mais barato é ótimo porque, como todos sabemos,
00:02:14as APIs da Anthropic são incríveis,
00:02:16mas são muito caras.
00:02:19E muitas vezes você sente que quer algo
00:02:21entre o Sonnet e o Opus, mas isso simplesmente não existia.
00:02:24Então, isso nos dá um meio-termo
00:02:26em termos de desempenho entre Sonnet e Opus,
00:02:28mas com um custo menor do que o Sonnet normal.
00:02:31O que não há para amar?
00:02:32Como eu disse antes, isso é algo da API,
00:02:33não necessariamente do Claude Code.
00:02:35Para usar isso, você só terá que ajustar seu código
00:02:38e como ele faz essas chamadas de API.
00:02:41Especificamente, você deve definir o tipo como "advisor",
00:02:45bem como o máximo de usos.
00:02:47O máximo de usos sendo o número de vezes
00:02:48que ele voltará ao Opus
00:02:50para obter conselhos sobre um problema específico.
00:02:52Para resumir, esta é uma atualização incrível.
00:02:54Se você usa a API da Anthropic
00:02:56em projetos reais fora do ecossistema Claude Code,
00:03:00estamos obtendo melhores resultados por um preço menor.
00:03:03Porque, como você sabe, muitas vezes o Opus é exagero
00:03:06para a grande maioria das coisas,
00:03:08mas às vezes você quer algo um pouco melhor que o Sonnet.
00:03:10E aqui está, este é o meio-termo perfeito.