Análise detalhada do acordo entre Anthropic e xAI

MMaximilian Schwarzmüller
컴퓨터/소프트웨어창업/스타트업경제 뉴스우주/천문AI/미래기술

Transcript

00:00:00Ontem, a Anthropic anunciou duas notícias interessantes que impactam os desenvolvedores e
00:00:07onde há um pouco mais por trás dessas notícias do que você pode pensar à primeira vista.
00:00:14Porque anunciaram que haveria limites de uso mais altos para o Claude, o que
00:00:19especialmente importa, claro, se você estiver usando o Claude Code, porque as chances são de que, como
00:00:24muitos outros, você frequentemente atinja esses limites de uso e os sinta um pouco restritivos demais,
00:00:31especialmente quando comparados, por exemplo, aos limites de uso do Codex.
00:00:35E a outra grande coisa que anunciaram ontem, que na verdade está relacionada ao primeiro
00:00:40anúncio, é que fecharam um acordo de computação com a SpaceX e que alugariam
00:00:48todo o data center Colossus 1, que é aquele data center que Elon Musk construiu em tempo recorde
00:00:55em 2024, que alugariam toda a capacidade, que é de cerca de 300 megawatts, então eles
00:01:03usariam isso para treinamento ou inferência e, portanto, teriam mais capacidade para trabalhar.
00:01:11Isso, claro, tem um impacto nos limites de uso que eles podem oferecer, embora haja um pouco mais
00:01:15por trás disso, mas é importante porque a Anthropic estava fortemente limitada em computação e ainda
00:01:22está, é justo avaliar, todas essas grandes empresas de IA estão porque estamos todos nesta
00:01:29situação, ou elas estão todas nesta situação, onde essencialmente a demanda por tokens não
00:01:36escalou linearmente, mas sim, essencialmente, de forma exponencial, porque hoje em dia
00:01:45temos todos esses modelos que permitem sessões agênticas de longa duração, sessões de codificação agênticas
00:01:53ou o que quer que você esteja fazendo com eles, não se trata apenas de codificação, esses modelos modernos e seus
00:01:59arreios agênticos são muito bons em outras tarefas, como ciência de dados e assim por diante, porque
00:02:04eles também geram código lá, mas essa é uma história diferente, mas porque esses modelos e
00:02:10as ferramentas em que rodam tornaram-se muito mais capazes e agora podem rodar por mais tempo,
00:02:16você e eu e todos os usuários estamos queimando muito mais tokens e isso simplesmente não é necessariamente
00:02:23o que essas empresas, o que a Anthropic planejou e definitivamente não é o que elas têm capacidade
00:02:29para, daí esse acordo em que eles realmente entram nessa parceria de computação com a SpaceX.
00:02:38Agora, o que é interessante é que neste post aqui eles compartilham que eles iriam, como eu mencionei,
00:02:43imediatamente adicionar esses 300 megawatts de nova capacidade, que são mais de 200.000 GPUs NVIDIA,
00:02:51novamente, tenha em mente que isso é de 2024, mas ainda assim é muita computação que eles podem adicionar
00:02:57agora mesmo e isso se junta aos seus outros anúncios significativos de computação que têm números
00:03:02ainda mais impressionantes de até 5 gigawatts acordados individualmente com a Amazon e o Google,
00:03:10mas aqui vale a pena notar que tudo isso se trata de capacidade planejada e não
00:03:16necessariamente online ainda.
00:03:17Os 5 gigawatts que eles acordaram com a Amazon incluem quase 1 gigawatt de nova capacidade
00:03:25até o final de 2026, então sim, não estamos nem perto desses 5 gigawatts ainda e para o
00:03:33acordo com o Google, também são 5 gigawatts que começarão a entrar em operação em 2027, então isso
00:03:39também não está lá ainda, então estamos falando de 10 gigawatts aqui que nem estão perto de
00:03:44estar disponíveis agora mesmo.
00:03:47Mas os 300 megawatts do data center da xAI estão.
00:03:52A pergunta, ou uma das perguntas que naturalmente surgem, é: o que isso significa para
00:03:57a xAI?
00:03:58Eles não precisam dessa capacidade?
00:04:00É o fim do Grok?
00:04:03E a resposta é não, talvez bem, não o fim do Grok, obviamente, mas acho que é justo
00:04:11dizer que se o Grok tivesse alguma demanda que fosse algo semelhante ou até próxima do que a Anthropic está
00:04:21vendo, eles não estariam alugando essa capacidade extra, em vez disso, claro, o que ocorre
00:04:27é claramente que eles não precisam dessa capacidade para o Grok, você pode se perguntar por quê?
00:04:31E a resposta para isso é que este data center Colossus aqui, que foi construído, como mencionei,
00:04:37em tempo recorde de 122 dias em 2024, este foi apenas o primeiro data center que eles construíram essencialmente,
00:04:46mas a xAI agora tem um cluster Colossus 2 ainda mais poderoso disponível para si mesmos, então eles
00:04:54podem usar isso para treinamento e inferência e esse não é o único data center, eles também adquiriram
00:04:59outro data center, o data center de hardware macro, e a xAI está em um roteiro para quase
00:05:062 gigawatts de energia com operações aumentando em 2026, então não é como se a xAI tivesse entregado toda
00:05:14a sua potência de computação, mas claro, uma parte dela e claramente eles não fariam isso se
00:05:18houvesse mais demanda para o Grok, mas como as coisas estão, isso naturalmente lhes dá uma boa maneira de utilizar
00:05:24esta capacidade não utilizada e ganhar alguma receita extra com isso e para a Anthropic
00:05:29significa, claro, que agora eles têm mais capacidade disponível, o que leva a esses limites de uso
00:05:35mais altos e eu acho que tudo isso é um pouco mais matizado do que você pode pensar, então claramente a Anthropic estava
00:05:43fortemente limitada em computação e eu quero dizer, todas essas empresas de IA estão lutando para conseguir o suficiente
00:05:50computação, eu falei sobre isso em outro vídeo, um episódio já, não vou entediar você com isso
00:05:56aqui, mas é claro que a computação é um grande problema por causa desse crescimento exponencial por causa
00:06:02dessas sessões agênticas de longa duração e de todos os tokens que são queimados por essas sessões
00:06:08que precisam ser inferidas, onde precisamos da inferência, então sim, esse é o ponto aqui
00:06:14mas agora, claro, a Anthropic pode aumentar esses limites de uso porque agora eles têm um pouco mais
00:06:21de capacidade disponível, isso é ótimo, mas além disso, eu argumentaria que eles também estão
00:06:27sob pressão para se manterem competitivos lá e isso também é algo que eu já defendi
00:06:32em outro episódio, porque, como mencionei, no passado tivemos, claro, o GitHub Copilot mudando
00:06:39para o faturamento baseado no uso, agora eles têm seus próprios motivos, eles também tinham um modelo de precificação ou
00:06:47eles basicamente davam um certo número de solicitações pelo seu pagamento, pela sua taxa de assinatura
00:06:54e, claro, cobrar solicitações em vez de tokens não é o ideal ou contar solicitações
00:07:01em vez de tokens não é o ideal porque, como temos essas sessões de longa duração, pode
00:07:06ser uma solicitação, mas muito mais tokens do que no passado, mas é claro que eles também poderiam ter
00:07:10usado um sistema de medição baseado em tokens e, em vez disso, mudaram direto das assinaturas
00:07:16para a precificação baseada no uso, no final das contas, então é claro que eles fizeram isso, a Anthropic tinha esses limites
00:07:24de uso relativamente rígidos, ainda uma assinatura, ainda baseada em tokens, mas relativamente rígidos quando comparados
00:07:31ao Codex, que é claro que é o seu grande concorrente, a OpenAI com seus modelos Codex
00:07:37ou o modelo GPT 5.5 agora e a ferramenta Codex e suas ofertas de assinatura e você tinha
00:07:43quantidades muito mais generosas de uso do Codex, você ainda consegue muito uso do Codex
00:07:50e o GPT 5.5, eu diria, é um modelo muito bom, então naturalmente acho que a Anthropic, claro, tem
00:07:58um grande incentivo para se manter competitiva, para aumentar sua participação no mercado e eles estão vendo um crescimento
00:08:03de receita incrível, a propósito, se você quiser aprender como obter o máximo do Codex e do Claude
00:08:09Code, como usar os recursos avançados também e não apenas o básico que você já conhece,
00:08:15então você pode querer dar uma olhada nos meus cursos ou até mesmo obter uma assinatura que lhe dá acesso
00:08:20a todos os meus cursos por uma taxa mensal ou anual fixa e você encontrará os links abaixo, mas como mencionado,
00:08:26é claro que a Anthropic está vendo um forte crescimento, eles provavelmente querem continuar nessa trajetória
00:08:32de crescimento, também, claro, já que eles têm toda essa capacidade ou já que eles têm toda essa
00:08:39capacidade aqui surgindo no próximo ano e assim por diante, então eles querem utilizar isso, eles querem
00:08:43crescer ainda mais com base nisso e eles precisam da receita, do dinheiro no final, para pagar
00:08:50por essa capacidade, então claramente eles querem continuar crescendo agressivamente, obviamente sem queimar
00:08:56muito dinheiro, mas eles querem continuar crescendo, querem aumentar sua participação no mercado para que
00:09:00eventualmente, em algum momento, possam aumentar os preços, isso certamente acontecerá em algum momento
00:09:05e é assim que chegamos a esses limites de uso mais altos, obviamente, como mencionei, combinado com
00:09:11o fato de que agora eles não estão mais tão limitados em computação quanto estavam antes, agora que eles
00:09:16conseguiram esse acordo com a SpaceX, mas há mais, há mais nesse acordo porque eu já mencionei
00:09:23sim, a xAI, que é claro parte da SpaceX, caso você não saiba, eles não teriam
00:09:31alugado esse data center Colossus 1 para a Anthropic se precisassem dele para si mesmos, claramente eles não precisam
00:09:38mas eles podem obter outra vantagem com isso porque naquele anúncio da Anthropic há
00:09:43esta frase interessante aqui: como parte deste acordo, também expressamos interesse
00:09:49em fazer uma parceria com a SpaceX para desenvolver vários gigawatts de capacidade de computação de IA orbital, hein
00:09:56isso é interessante porque a SpaceX, caso você não tenha visto, está planejando lançar data centers
00:10:02orbitais, o que faz sentido, quero dizer, é a especialidade deles, lançar coisas no espaço, é
00:10:09o argumento que estava sendo feito no final para a aquisição da xAI, que é um negócio totalmente
00:10:15interessante por si só, a propósito, Elon Musk comprando o Twitter por acidente, depois fundando
00:10:22a xAI, depois fazendo a xAI comprar o X Twitter e depois fazendo a SpaceX comprar a xAI, tudo com a ajuda de nossos
00:10:29investidores, essa é uma maneira inteligente de ficar mais rico, para dizer o mínimo, mas um dos argumentos
00:10:34é claro que eles querem lançar esses data centers orbitais, esse foi o raciocínio
00:10:40para o acordo de aquisição da xAI e agora, claro, eles têm a Anthropic a bordo também, ou não?
00:10:46Bem, talvez não necessariamente, eles expressaram interesse, então isso poderia muito bem ser apenas alguma
00:10:52frase que eles concordaram em colocar lá para que a SpaceX tenha alguma história legal para quando
00:10:58estiver tentando fazer sua oferta pública, seu IPO, no final deste ano, para que possam dizer que
00:11:04não é apenas para seus próprios data centers, mas que também têm a Anthropic a bordo e então
00:11:09isso é um bom negócio. A Anthropic fica com o data center Colossus 1 e pode usar data centers orbitais
00:11:14no futuro, mas não se compromete com isso agora porque existem alguns problemas com data centers
00:11:19orbitais, ainda falta provar que este é realmente um bom investimento, para dizer o
00:11:26mínimo, e que eles realmente superam os data centers na Terra e entregam vantagens significativas
00:11:32mas eles podem, claro, participar e, novamente, para a SpaceX é bom poder apontar para a Anthropic
00:11:37como um potencial futuro cliente para o seu IPO. E eu acho que é isso que vale a pena saber sobre
00:11:46este negócio. O lado bom são os limites de uso mais altos, também, é claro, no futuro muita capacidade
00:11:53entrando online para a Anthropic, mas como eu mostrei, espero que haja um pouco mais por trás disso. Se
00:11:59isso é bom ou ruim para nós como desenvolvedores ou para a humanidade como um todo é uma história totalmente diferente
00:12:05você pode ter opiniões diferentes sobre IA e eu certamente tenho, como você sabe, se ouviu outros
00:12:11episódios ou assistiu a outros vídeos meus, mas é isso que está acontecendo aqui para a Anthropic
00:12:16e o que isso significa a curto prazo para nós, desenvolvedores.

Key Takeaway

A Anthropic alugou o data center Colossus 1 da xAI para obter 300 megawatts de capacidade imediata e 200.000 GPUs, superando gargalos de computação enquanto aguarda a ativação de 10 gigawatts em parcerias futuras com Google e Amazon.

Highlights

  • A Anthropic alugou a capacidade total de 300 megawatts do data center Colossus 1 da xAI para expandir seus recursos de treinamento e inferência.

  • O acordo garante acesso imediato a mais de 200.000 GPUs NVIDIA, permitindo que a Anthropic eleve os limites de uso do Claude e do Claude Code.

  • A demanda por tokens cresce de forma exponencial devido ao uso intensivo de sessões agênticas de longa duração em tarefas de codificação e ciência de dados.

  • A Anthropic possui contratos futuros de 10 gigawatts de capacidade com Amazon e Google, mas essa infraestrutura só estará operacional entre o final de 2026 e 2027.

  • A xAI migrou suas operações principais para o cluster Colossus 2 e projeta atingir 2 gigawatts de potência total até o decorrer de 2026.

  • O acordo inclui uma manifestação de interesse da Anthropic no desenvolvimento de data centers de IA orbitais em parceria com a SpaceX.

Timeline

Expansão de limites e o acordo Colossus 1

  • Os limites de uso do Claude tornaram-se menos restritivos após a expansão da infraestrutura de computação.
  • A Anthropic assumiu o controle total do data center Colossus 1, construído por Elon Musk em 2024.
  • A nova capacidade disponível totaliza aproximadamente 300 megawatts de energia para processamento.

O aumento nos limites de uso responde diretamente às reclamações de desenvolvedores que atingiam restrições frequentes no Claude Code. O aluguel da infraestrutura da SpaceX fornece o suporte necessário para suportar cargas de trabalho de inferência mais pesadas. Esta movimentação resolve a escassez imediata de hardware que limitava a experiência do usuário final.

A crise de capacidade gerada por modelos agênticos

  • A demanda por processamento de tokens cresce exponencialmente em vez de linearmente.
  • Sessões de codificação agênticas consomem significativamente mais recursos de hardware do que interações simples.
  • Modelos modernos são capazes de realizar tarefas complexas e duradouras que 'queimam' tokens rapidamente.

A evolução das ferramentas de IA para sistemas agênticos, que operam de forma autônoma em fluxos de trabalho de ciência de dados e programação, alterou o consumo de infraestrutura. A Anthropic não previu inicialmente a escala de computação exigida por essas sessões de longa duração. O acordo de computação com a SpaceX serve como uma medida emergencial para suprir essa discrepância entre planejamento e uso real.

Cronograma de infraestrutura e parcerias com Big Techs

  • O data center da xAI adiciona instantaneamente mais de 200.000 GPUs NVIDIA à rede da Anthropic.
  • Parcerias com Amazon e Google somam 10 gigawatts de capacidade planejada para os próximos anos.
  • A infraestrutura da Amazon terá cerca de 1 gigawatt online apenas no final de 2026, com o Google iniciando em 2027.

Embora a Anthropic tenha garantido contratos massivos com gigantes da tecnologia, a maior parte dessa energia ainda não está conectada à rede. Os 300 megawatts da xAI são cruciais porque estão prontos para uso imediato em 2026. Isso preenche o hiato temporal até que as instalações de larga escala da Amazon e do Google entrem em operação total.

Impacto na xAI e a estratégia do Grok

  • A xAI alugou o Colossus 1 porque possui o cluster Colossus 2, ainda mais potente, para suas próprias necessidades.
  • A demanda pelo modelo Grok é inferior à capacidade total de hardware disponível para a xAI no momento.
  • A xAI utiliza o aluguel para gerar receita extra enquanto escala para 2 gigawatts de potência em 2026.

O descarte do uso do Colossus 1 pela xAI indica que a infraestrutura disponível superou a demanda de mercado do Grok. A empresa de Elon Musk diversificou sua base de hardware com a aquisição de novos centros de dados e o desenvolvimento do Colossus 2. Alugar a capacidade excedente para um concorrente como a Anthropic otimiza a utilização de ativos financeiros e operacionais.

Competitividade e faturamento baseado no uso

  • A Anthropic sofre pressão competitiva direta de modelos como o GPT-5.5 e a ferramenta Codex da OpenAI.
  • O mercado está migrando de assinaturas fixas para modelos de faturamento baseados estritamente no consumo de tokens.
  • O crescimento agressivo da participação de mercado é prioridade para cobrir os altos custos de infraestrutura futura.

A OpenAI oferece limites de uso mais generosos no Codex, forçando a Anthropic a ajustar sua oferta para não perder desenvolvedores. O aumento da capacidade permite que a empresa busque maior receita para financiar os gigawatts de energia contratados. A estratégia visa consolidar uma base de usuários sólida antes de eventuais ajustes de preços no futuro.

O futuro da computação em IA orbital

  • A SpaceX e a Anthropic avaliam a criação de gigawatts de capacidade em data centers localizados no espaço.
  • A proposta orbital visa utilizar a especialidade de lançamento da SpaceX para infraestrutura de IA fora da Terra.
  • A inclusão da Anthropic como potencial cliente fortalece a narrativa para a oferta pública inicial (IPO) da SpaceX.

A parceria orbital ainda é teórica e serve como uma sinalização de mercado para investidores. Existem desafios técnicos significativos para provar que o processamento no espaço é superior aos centros terrestres em termos de latência e custo. Para a Anthropic, o interesse formal garante acesso a tecnologias de vanguarda sem um compromisso financeiro imediato e vinculativo.

Community Posts

View all posts