Classificando Todas as Ferramentas de IA que usei em 2026 (O que REALMENTE funciona)

Portuguêsالعربية Deutsch English Español Français हिन्दी Bahasa Indonesia 日本語 한국어 Русский 中文

컴퓨터/소프트웨어창업/스타트업경영/리더십AI/미래기술

Transcript

00:00:00Existem ferramentas de IA demais em 2026, e tornou-se impossível descobrir

00:00:05quais realmente valem o seu tempo e dinheiro. E como não tenho nada melhor para fazer,

00:00:10testei uma tonelada delas nos últimos meses. E hoje vou classificar todas

00:00:15elas. Vou cobrir tudo, desde chatbots básicos até agentes de codificação completos e

00:00:20tudo o que há entre eles. Então, no final deste vídeo, você saberá em quais deve realmente focar.

00:00:27Então, vamos classificar isso usando o formato padrão de lista de níveis (tier list). O nível S é o melhor,

00:00:32o nível D é o pior, e todas essas ferramentas serão agrupadas com base em suas funções.

00:00:36Agora, quando se trata de avaliar uma ferramenta específica, vamos analisá-la sob duas lentes. Uma é: como

00:00:42ela se classifica em relação às outras ferramentas da sua categoria? Então, como o N8N se compara a outras ferramentas de automação no-code

00:00:49como Make ou Zapier? Mas também daremos uma olhada no nível macro, porque você pode ser

00:00:56o melhor da categoria em algo como automação no-code. Mas isso significa que você é automaticamente nível S

00:01:00só porque superou todos na sua categoria? Não necessariamente, porque tudo isso está interligado.

00:01:05Essas ferramentas funcionam em conjunto. O que era ótimo há seis meses pode estar tendo problemas

00:01:11hoje. Então, quando eu classificar suas ferramentas favoritas no nível D, certifique-se de deixar um comentário e me dizer

00:01:14o quanto você odeia meus critérios de avaliação subjetivos e muito vagos. Vou me certificar de manter isso em mente na próxima

00:01:20vez. Então, vamos começar com os chatbots. E o primeiro que vamos classificar é o ChatGPT. Agora,

00:01:26é aqui que muitos de nós começamos. E, pelos números, a maioria das pessoas ainda está aqui.

00:01:31Em um nível macro, o ChatGPT está definitivamente subindo no meu ranking porque seus modelos

00:01:35são muito sólidos. O 5.4 é um ótimo modelo. No entanto, quando falamos sobre o chatbot em si,

00:01:40eu fico com uma sensação de "meh", é bom. Ele se tornou o chatbot mediano por excelência.

00:01:47Você não vai odiar as saídas. Você não vai amar as saídas. E, infelizmente,

00:01:51se você for ruim em fazer prompts, terá respostas muito genéricas. Todos nós já sabemos reconhecer

00:01:56a escrita do ChatGPT a esta altura. Mas, por 20 dólares por mês, consigo tirar muito proveito dele. E tem alguns

00:02:00extras, como geração de imagens. E o novo modelo de geração de imagens é realmente muito bom.

00:02:04E por falar em geração de imagens, vamos falar de outro chatbot. E esse é o Gemini. Agora, o Gemini,

00:02:10já vou te dizer logo de cara: nível A. Acho que, se você for apenas o tipo de pessoa que vai

00:02:15gastar 20 dólares por mês em um chatbot de IA, você só quer um companheiro diário. O Gemini é sua melhor aposta de longe.

00:02:21É melhor que o Claude nesse aspecto. E o que quero dizer com isso? Você vai obter proveito suficiente

00:02:25dele como uma pessoa comum. Além disso, o Gemini me oferece geração de imagens

00:02:31e o Nano Banana Pro é o melhor da categoria. Posso obter geração de vídeo. E, importantemente, o que ele faz melhor

00:02:36do que qualquer outro modelo de chat é lidar com os vídeos em si. Posso dar ao Gemini vídeos do YouTube. Posso dar a ele

00:02:42vídeos de formato curto, Reels, TikToks, o que for, e ele consegue realmente analisar. Os outros

00:02:46realmente sofrem nesse departamento ou não conseguem fazer isso de jeito nenhum. Agora, no vácuo, eu acho que o 3.1 é

00:02:50melhor que o 5.4 ou o Opus, como vamos falar? Não. Mas acho que, holisticamente, por 20 dólares por

00:02:55mês, como companheiro diário, você deveria estar usando o Gemini. E então vem a Anthropic. Então, onde colocamos o Claude?

00:03:00Isso é difícil, porque quando falamos sobre o Claude e o Opus 4.7, o Opus 4.7 é o melhor modelo no

00:03:08jogo agora, pelo menos na minha opinião. E eu acho que a Anthropic é a melhor entre os

00:03:12três principais players. No entanto, se estivermos falando puramente do chatbot e você estiver em um plano de 20 dólares por mês,

00:03:18você poderia argumentar que é nível C. Puramente, puramente baseado nos problemas de uso. Se você está em um plano de 20 dólares por

00:03:26mês e está tentando usar o Opus para qualquer projeto real ou fazer com que ele realmente gere

00:03:31qualquer coisa, você vai bater na parede tão rápido que vai se perguntar: o que estou fazendo?

00:03:35Porque, por 20 dólares por mês, provavelmente consigo uma saída que é uma solução de 95% e posso

00:03:41fazer isso um milhão de vezes. Enquanto isso, a Anthropic limita seu uso muito fortemente se você

00:03:45não estiver em um plano de 100 ou 200 dólares por mês. Além disso, quando se trata de coisas como o Sonnet e o Opus,

00:03:50tudo o que ele pode fazer é texto, código e esses artefatos. Não posso fazer imagens. Não posso fazer vídeos. É apenas texto.

00:03:58Então, se você é o usuário médio de IA que está apenas usando um chatbot, eu diria que é nível C.

00:04:05No entanto, se você estiver em um plano de 100 ou 200 dólares por mês, é nível S. A menos que você esteja tentando

00:04:14fazer coisas como vídeos ou imagens. Então, quando se trata do Claude, é muito dependente do caso de uso e muito

00:04:20dependente do uso. Então, para o cara comum que vem da rua, que só quer saber em qual IA deve gastar

00:04:2520 dólares por mês: nível C. Mas se você leva isso a sério, tem um plano de 100 ou 200 dólares por mês: nível S.

00:04:31E então houve o Grok. Onde colocamos o Grok? Bem, ele é pior que todos esses em tarefas de codificação.

00:04:37Ele tem um modelo de imagem muito pior que o ChatGPT ou o Gemini. Seu modelo de vídeo é pior que o do Gemini

00:04:44e, na verdade, tudo o que ele tem a seu favor são menos travas de segurança e é muito bom logo de cara

00:04:50em termos de descobrir o que está acontecendo no mundo real naquele exato momento.

00:04:55Então, é ótimo se você é "viciado em Twitter", talvez se você for, seja nível B+. Para

00:05:00o usuário médio, nível C. Para ser totalmente honesto com você. E quando falamos, ah, ele é ótimo em

00:05:06lidar com vídeo, tipo, posso alimentá-lo com um post do Twitter, ele sabe o que está acontecendo. Novamente, se você estiver

00:05:10hiperfocado na funcionalidade do Twitter, claro. Talvez nível A. Para o usuário médio, nível C, na melhor das hipóteses. Você

00:05:17nunca recomendaria isso para alguém que não passa quatro horas por dia no Twitter. Agora, antes de pularmos

00:05:21para o ranking dos agentes de codificação, só quero fazer um rápido merchan da minha masterclass de Claude Code.

00:05:26Ela foi lançada no mês passado e é a maneira número um de ir do zero ao desenvolvedor de IA, especialmente se

00:05:31você não vem de uma formação técnica. Eu a atualizo toda semana e, ultimamente, temos realmente

00:05:35focado em como construir um SO agente que é alimentado pelo Claude Code e traz coisas como

00:05:42Obsidian para memória e GWS para conectá-lo a coisas como o Google Suite. Então, se você tiver interesse

00:05:48nisso, pode encontrar dentro do Chase AI Plus; haverá um link no comentário fixado. Então é isso para

00:05:52os chatbots. Agora vamos passar para os agentes de codificação ou "harnesses" de codificação como o CodeX e

00:05:57o Claude Code. E, falando em Claude Code, esse será o primeiro que discutiremos agora. O Claude Code é nível S

00:06:03para mim. No entanto, é o mesmo tipo de conversa de antes. O que estamos discutindo em termos de

00:06:10uso? Se você acha que pode aparecer no Claude Code com um plano de 20 dólares por mês e obter qualquer coisa dele,

00:06:15você está enganado. Vou mantê-lo no nível S aqui porque, se você está usando o Claude Code

00:06:19e leva a sério a construção, você vai ter um plano de 100 dólares por mês, no mínimo,

00:06:24ou 200 dólares por mês. E podemos ficar aqui reclamando sobre os usos e tudo isso,

00:06:29mas o fato permanece que há uma razão para isso ter se tornado essencialmente um padrão da indústria.

00:06:33Ele é bom. E você precisa lembrar que, mesmo no preço de 100 ou 200 dólares por mês,

00:06:38você ainda obtém uma redução de cerca de 90% no que seu uso normal de tokens custaria se você estivesse usando

00:06:44as APIs para algo como o Opus 4.7. Agora, existe um contingente muito barulhento de pessoas que dirá:

00:06:50Ei, o Claude Code foi "nerfado". O Opus 4.6 foi "nerfado". Há problemas com o 4.7. Sim.

00:06:55Mas acho que isso tem muito mais a ver com as realidades da discussão online sobre qualquer ferramenta

00:07:02que se torna popular. E, francamente, mais com falta de habilidade do que com alguma trama secreta para "nerfar"

00:07:08o Claude Code. No entanto, só porque o Claude Code é nível S, isso não significa que é o único jogo na

00:07:12cidade, porque se você realmente é da opinião de que a Anthropic está indo ladeira abaixo e esses lançamentos do Opus 4.6 e

00:07:194.7 foram abaixo do padrão, bem, você tem opções, nomeadamente o CodeX, que é o da OpenAI, você sabe,

00:07:26o fabricante da versão do ChatGPT do Claude Code. E eu vou te dizer agora que é nível S também. E

00:07:31tem algumas vantagens sérias sobre o Claude Code. A principal delas é o uso. Consigo obter muito mais

00:07:38tokens do CodeX do que do Claude Code. Além disso, os modelos da OpenAI são bons. O que quer que

00:07:45você esteja fazendo com o Opus 4.6 ou 4.7 pode ser feito com o GPT 5.4, talvez nas margens. E estamos falando

00:07:52de complexidade extrema. Você pode argumentar a favor de um ou de outro, e haverá toneladas de pessoas que

00:07:56argumentarão a favor dos modelos da OpenAI em relação aos modelos da Anthropic, mas para 99% das pessoas, realmente não

00:08:02haverá uma enorme diferença. E então, quando a questão é: "deveria ser Claude Code ou deveríamos usar

00:08:07CodeX?", a resposta é simplesmente escolher um. Qual é a sua preferência pessoal? Agora, o que dizer de algo

00:08:12como o Anti-Gravity, que desempenha o papel de "harness"/IDE, meio que, ainda no espaço

00:08:18ainda. Onde isso vai? Bem, não muito tempo atrás, eu o teria colocado no nível S e dito que havia meio que

00:08:21esse triunvirato aqui em cima desses agentes de codificação, mas hoje em dia eu o colocaria no nível A. A verdade

00:08:27é que o Anti-Gravity, quando usado com outros modelos do Google como o Gemini 3.1, simplesmente não é tão bom

00:08:32quando se trata do Claude Code com Opus ou CodeX com algo como o 5.4, você estaria melhor usando

00:08:39o Anti-Gravity com esses outros modelos, o que então levanta a questão: por que usar o shell

00:08:44Anti-Gravity ao redor dele para começar? Por que não apenas usar algo como o Claude Code ou a OpenAI com seus

00:08:49modelos nativos para os quais ele foi realmente construído? Além disso, você está começando a ver algumas pessoas reclamarem

00:08:52sobre problemas de uso com o Anti-Gravity também. Quando, quando ele surgiu, eles praticamente te davam

00:08:58uso total de graça para sempre, era o que parecia. Agora, a próxima ferramenta da qual vamos falar não é realmente um

00:09:03agente de codificação ou "harness" ainda, é frequentemente falada com esses outros, então vamos incluí-la

00:09:07aqui, e esse é o OpenClaw. Agora, tenho sido bastante vocal no passado sobre minha aversão ao OpenClaw

00:09:12e, para ser honesto, isso não mudou. Eu o colocaria como nível C e, discutivelmente, nível D. O OpenClaw

00:09:18é teatro de performance. Quando você está usando o OpenClaw, parece que muita coisa está acontecendo. Estamos fazendo

00:09:23dashboards, estamos conectando coisas, ele tem um batimento cardíaco, ele está falando comigo. Há muito

00:09:28movimento acontecendo, mas não há muito avanço. Você sente que está fazendo coisas e, para

00:09:32muitas pessoas, isso é o suficiente, mas o fato é: quatro meses depois, três meses depois, e isso

00:09:39ainda será o caso daqui a três anos. Ainda estou esperando alguém vir e me dizer: "oh, aqui está

00:09:44esse caso de uso do OpenClaw que eu faço e que não pode ser feito dentro do Claude Code ou CodeX e que não pode ser feito

00:09:52com mais eficiência pelo Claude Code ou CodeX?". E se você me disser que é um relatório matinal ou algum tipo de

00:09:57briefing, vou banir você do canal. E esse ranking baixo do OpenClaw só ficou mais

00:10:02óbvio desde que a Anthropic veio a público e disse que você não pode usar sua assinatura Max dentro do OpenClaw,

00:10:10o que significa que você precisa pagar preços de API para algo como o Opus 4.7. Agora, ressalva: literalmente hoje, algo

00:10:16saiu onde eles estão tipo, "ah não, uh, está nos docs do OpenClaw onde diz que conversamos com alguém

00:10:21da equipe da Anthropic e eles disseram que está tudo bem agora". Eu sinto que precisamos de um pouco mais de prova do que

00:10:28alguma linha única na documentação deles dizendo que falamos com um cara. Então, até que isso seja confirmado, é

00:10:36loucura pensar que o OpenClaw é algum tipo de substituto do Claude Code, e eu entendo que eles não são

00:10:40a mesma coisa, ainda assim, as pessoas usarão isso em vez do outro, ou dirão: "oh não, meu OpenClaw chama o Claude Code

00:10:46para fazer coisas". Por quê? Por que não chamar o Claude Code você mesmo? E vou encerrar essa discussão aqui

00:10:52mas OpenClaw, e basicamente a mesma coisa com o Hermes, certo? Acho que o Hermes é um pouco

00:10:59melhor, mas vou colocá-lo em um nível C sólido. Isso é apenas teatro de produtividade. Parece que estamos fazendo

00:11:06muito, mas você pode fazer tudo isso dentro de um agente de codificação real, você simplesmente pode. Agora, o Hermes meio que tem

00:11:12algumas coisas inteligentes acontecendo com, você sabe, essas habilidades de autoatualização, mas a coisa das habilidades de

00:11:18autoatualização também chega muito perto dessa ilusão de que algo bom está acontecendo, onde é tipo, "oh não,

00:11:25a cada 15 chamadas de ferramenta, ele está dando uma olhada em suas habilidades e reescrevendo-as". Ele precisa?

00:11:29Como estamos determinando que essa nova está realmente funcionando? Por que eu não usaria o Claude Code e usaria

00:11:36algo como a habilidade de criador de habilidades para dar uma olhada nas habilidades que tenho usado regularmente ou, eu

00:11:40não sei, olhar as saídas eu mesmo e determinar se precisamos fazer isso? Então, esse tipo de

00:11:46ferramenta, você também poderia jogar algo como o Paperclip aqui; muito acontecendo, nada acontecendo.

00:11:53Agora, você notará que não estou cobrindo alguns outros "harnesses" de codificação populares, coisas como

00:11:58o OpenCode. A verdade é que simplesmente não os usei muito, não sinto que posso falar

00:12:01inteligentemente sobre eles, e isso se torna, eu acho, uma discussão que entra na rota do modelo

00:12:08de código aberto, a qual eu acho que é um caminho inteiro à parte. Acho que se você está profundamente na rota

00:12:15de código aberto, você meio que já sabe o que está fazendo, porque a pessoa média não

00:12:21vai estar tocando nisso, nem tem o hardware para fazer isso em qualquer nível. Dito

00:12:25isso, ouvi apenas coisas boas sobre coisas como o OpenCode e o Pi, então se você gosta, continue

00:12:29fazendo isso. Agora, vamos passar para alguns desses construtores no-code, coisas como o Lovable e o N8N. E eu entendo que

00:12:36existe alguma delineação aí entre coisas orientadas a automação como o N8N e o Lovable, mas vamos

00:12:40avaliar todos eles sob um mesmo guarda-chuva. Então, o primeiro é o Lovable. O Lovable, se você me fizer

00:12:48essa pergunta, você sabe, há nove meses, Lovable, eu o teria colocado no nível S. Eu amava o Lovable quando ele

00:12:56saiu, ele praticamente pegou aquela base do que era, o quê, Sonnet 3.5 na época, Opus

00:13:023 na época, e realmente o ajustou para lhe dar um ótimo design de front-end, e embora fosse meio

00:13:08caro, não parecia loucura. Agora, o Lovable, é tipo, qual é o sentido? Qual é o sentido? O

00:13:16Lovable, o Lovable vai estar por aí em um ano, dois anos? Quando você sugeriria a alguém usar o Lovable?

00:13:27Tipo, não há sentido, não há sentido quando o CodeX existe, quando o Claude Code existe, quando até alguns desses

00:13:33chatbots existem. Você está pagando um prêmio insano para ter uma configuração Superbase de um clique

00:13:40ou um deploy de um clique, e esses outros sistemas tornaram-se tão bons, especialmente coisas como o

00:13:47Claude Code, criando designs de front-end que são tão bons quanto o que o Lovable produz, que é tipo:

00:13:52pelo que você está pagando o preço? Pela conveniência? Porque quanto você está disposto a pagar

00:13:57por mês por conveniência? Porque é um prêmio insano, e em um certo ponto a conveniência

00:14:01não importa, porque se você está construindo um aplicativo real, existe algum tipo de complexidade técnica ou

00:14:06pelo menos obstáculos que você terá que navegar não importa o quê, e se você pudesse fazer isso, você poderia

00:14:11fazer isso nesses, você poderia fazer isso no Anti-Gravity. Então, tipo, o Lovable não é um produto ruim de forma alguma, mas

00:14:17quando você o compara à concorrência e ao ecossistema em geral, é difícil justificar sua

00:14:23existência. Quero dizer, alguém está recomendando o Lovable hoje em dia? Eu certamente não estou. E isso se aplica ao

00:14:29Bolt também, que é apenas, a esta altura, outra versão do Lovable. Lembra quando o Bolt surgiu pela primeira vez?

00:14:33Foi tipo selvagem, tipo: "oh meu Deus, essa coisa está criando um aplicativo do zero", e o que estamos,

00:14:38um ano e meio depois, estou tipo: ah, nível D, nunca recomendaria. Eles estão tipo: este é um espaço

00:14:43morto. E quando não tenho coisas como o Base 44 e esses tipos de coisas, como o Replit,

00:14:49tipo, acho que é para onde eles estão indo também. Não os usei o suficiente para dar uma ótima resposta

00:14:53mas, novamente, acho que quando você olha para o futuro e vê a si mesmo competindo

00:14:59contra o Claude Code, o CodeX e o Anti-Gravity, eles só vão ficar mais fáceis de usar. Quero dizer,

00:15:05olhe para coisas como Co-Work, vai ficar mais fácil de usar. E você, o zeitgeist cultural

00:15:11aqui é: Claude, Claude, Claude, Claude. Tipo, se você é Replit, se você é Base 44, certamente se você é Bolt ou Lovable,

00:15:17que chance você tem a longo prazo? Não acho que pareça ótimo. Agora, o Cursor é um interessante

00:15:22porque pode ser usado em combinação com o Claude Code e o CodeX. E eu fiz isso por muito

00:15:27tempo, eu essencialmente usei o Cursor como meu IDE, como meu VS Code com esteroides, e usei o Claude Code

00:15:34e a ideia era: ok, o Claude Code vai fazer 99% do trabalho, mas se eu quiser fazer uma verificação cruzada

00:15:39do trabalho, bem, estou dentro do Cursor, então você sabe, eu poderia ter um GPT 5.4 dando uma olhada diretamente no

00:15:46trabalho que o Claude Code fez e dizer: ei, isso foi bom, isso foi ruim. Era um segundo par de olhos muito fácil de usar.

00:15:52Hoje em dia, o que precisamos disso? Bem, em primeiro lugar, você certamente não precisa, porque posso usar o CodeX dentro

00:16:02do Claude Code. Existe um plugin que podemos usar e podemos fazer uma revisão de código, revisão de código adversária.

00:16:08Então, esse caso de uso específico está fora de questão. Nós amamos o Composer 2.0? Talvez você ame, se esse for o

00:16:15caso e você ama o Composer, talvez seja nível A, talvez seja meio como no espaço do Anti-Gravity, mas para

00:16:21mim hoje em dia, eu diria que é nível B, tipo, não é um produto ruim de forma alguma, não me entenda mal, não estou dizendo

00:16:25que você não deveria usar o Cursor. Acho que é um ótimo produto. É apenas, novamente, quem é o cliente

00:16:30do Cursor e por que eles estão escolhendo o Cursor em vez desses outros caras? Acho que é um passo

00:16:37distante de todo aquele problema do Lovable. E provavelmente deveria ter falado sobre esses caras

00:16:41na última seção, mas o Gemini CLI. Nomeie 10 pessoas que usam o Gemini CLI que não trabalham para o Google.

00:16:47Entendeu? Acho que, por virtude de estar literalmente ausente da discussão e, novamente, alguém

00:16:55realmente usa isso? Se a resposta for não, provavelmente há uma razão para isso. Eu literalmente não

00:16:59conheço uma única pessoa que usa o Gemini CLI ou afirmou usá-lo e que, literalmente, não seja um

00:17:04funcionário do Google, e acho que isso diz muito. Agora, quanto ao N8N, oh, eu fui um super fã do N8N por

00:17:11muito tempo, então isso era um nível S automático por muito, muito tempo. Hoje em dia, o N8N foi de "essa é

00:17:18a ferramenta ideal que você deve usar para criar agentes de IA e automações sem usar código" para uma ferramenta

00:17:26muito de nicho, porque vamos ser honestos, tudo o que o N8N pode fazer, o Claude Code pode fazer, tudo o que o N8N pode fazer, o CodeX pode

00:17:33fazer, e se você é uma ferramenta onde posso dizer que tudo o que você faz o Claude Code ou o CodeX pode fazer, é melhor haver um

00:17:40motivo muito convincente ou um diferencial convincente, seja facilidade de uso, custo, nicho, para justificar

00:17:48sua existência. Para o N8N, ele ainda tem isso, e acho que é o nicho e a facilidade de uso, mas eu só

00:17:55uso o N8N hoje em dia para projetos de clientes se for um projeto de cliente para uma equipe muito não técnica onde,

00:18:01por qualquer motivo, eles também precisam ser práticos, então, em algum momento, precisarão da capacidade

00:18:06de entrar na automação e talvez ajustar uma ou duas coisas. O N8N torna isso muito fácil de fazer, a

00:18:11configuração visual é ótima. Mas, quero dizer, novamente, a facilidade de uso agora está se tornando o diferencial do N8N, não é

00:18:19porque é muito mais rápido, quer seja do que o Claude Code... posso configurar, posso configurar, posso configurar

00:18:27automações N8N mais rápido dentro do Claude Code do que posso fazer através do próprio N8N. Isso é meio que um

00:18:32problema para a viabilidade a longo prazo, eu acho. Quero dizer, então foi de, eu acho, meio que onipresente nesse

00:18:39espaço de IA no-code para, talvez, se você precisar por um motivo específico e precisar de alguma justificativa

00:18:45para fazê-lo. Mas, tipo, o produto em si não mudou, ele ainda faz o que faz muito bem, mas a concorrência direta

00:18:50do N8N, como Make e Zapier, nível D: mais caro, menos flexibilidade, para que se preocupar? Então, novamente,

00:19:00qual é o seu diferencial? Se você não pode fazer isso, você vai morrer. Então não sei por que alguém usaria

00:19:04o por que alguém usaria o Make ou Zapier a esta altura, além de razões legadas, e vamos trazer alguns dos retardatários

00:19:09a esta altura, o NotebookLM, onde o NotebookLM se encaixa? É quase como uma ferramenta de IA de nicho, como

00:19:15não é um agente de codificação, não é realmente algo de não código, embora haja um argumento a ser feito de que

00:19:20ele é, certo? Se eu puder dar um comando e dar contexto, ele cria coisas para mim, então mais ou menos

00:19:25dito isso, o NotebookLM é incrível e é nível S, com certeza, para uma ferramenta de IA de uso único, eu acho

00:19:33o NotebookLM é o melhor que existe, acho que é o melhor produto do Google, para ser franco, e o

00:19:38fato de que posso integrá-lo dentro do Claude Code, certamente posso integrá-lo com o Anti-Gravity usando

00:19:43coisas como o NotebookLM pi CLI, é um impulso de produtividade tão gigante e o Google permite que você faça

00:19:50tanto nele de graça, o que é incrível, e você pode criar entregáveis muito bons, coisas como

00:19:55apresentações de slides, infográficos, e é a melhor maneira, na minha opinião, de fazer qualquer tipo de pesquisa que

00:20:01envolva muitos vídeos do YouTube, então fiz muito conteúdo combinando o Claude Code e o NotebookLM

00:20:07por um ótimo motivo, porque o NotebookLM é incrível, é gratuito, outro que não mencionamos, talvez

00:20:13deveríamos ter mencionado nos chatbots, o Perplexity, agora o Perplexity é um chatbot, ainda assim, será que alguém está usando

00:20:20o Perplexity como seu único chatbot autônomo? Talvez, talvez o argumento hoje em dia com o Perplexity seja

00:20:26que é o chatbot que permite usar vários outros chatbots, mas por muito tempo foi nível S para mim

00:20:34e, novamente, como tantas ferramentas, está começando a cair, hoje em dia eu colocaria o Perplexity no nível C

00:20:40e talvez isso se deva em grande parte ao fato de eu não ser um usuário das ferramentas periféricas do Perplexity, como

00:20:47o Computer ou Comet, seu navegador, e por causa disso, percebo que só uso o Perplexity

00:20:53e estou no plano Pro, eu realmente uso o Perplexity quando penso: "Tudo bem, só quero obter

00:20:58informações sobre algo que aconteceu hoje e quero as fontes, e não quero ter que

00:21:03fazer comandos abertos ao Claude ou ChatGPT para fazer uma busca na web para obter esses dados reais", então, de certa forma,

00:21:10é quase como o Grok com esteroides, onde ele é muito bom em buscar na web e é feito para

00:21:16fazer isso, mas, novamente, é uma ferramenta para o dia a dia? Não. Vale a pena pagar 20 dólares por mês além dessas outras

00:21:22ferramentas? Não, é algo "bom de ter", é algo "bom de ter", e em nossa última categoria vamos falar

00:21:28sobre algumas dessas ferramentas de criação de conteúdo, geradores de imagem, geradores de vídeo, esse tipo de coisa, agora

00:21:33o primeiro da lista é um produto recente, e é o Design by Claude, agora, no vácuo, eu o colocaria no

00:21:42nível S, eu absolutamente amo o Design, você sabe, venho usando muito nestes últimos dias e é um enorme

00:21:49passo à frente do Claude Code básico e também é um enorme passo à frente da maioria das habilidades que vemos por

00:21:55aí, coisas como, bem, certamente a habilidade de design de front-end, a habilidade de UI/UX Pro supera isso

00:22:00com folga, e logo de cara, ele faz um ótimo, ótimo trabalho permitindo que você muito rapidamente

00:22:05itere através de um monte de visuais, no entanto, vírgula, o uso é a pior coisa que já vi na minha

00:22:12vida, você o consome a uma taxa insana, não ganho uso extra mesmo pagando 200 dólares

00:22:18por mês, tenho o mesmo uso de alguém no plano Pro, por quê? E não está muito claro o que

00:22:23consome tudo isso, embora, depois de fazer alguns experimentos, depois que você esgota tudo,

00:22:26torna-se muito óbvio, criar um sistema de design pode consumir 30% dos seus tokens, pedir uma página de destino simples

00:22:32pode consumir cerca de 5% dos seus tokens, então o uso é difícil, no vácuo é nível S, o uso é nível D

00:22:39então acho que, no final das contas, um nível B meio que divide a diferença, ótima ferramenta, uma vez que

00:22:50eles ajustarem o uso, será incrível, um dos melhores produtos, para ser honesto, mas agora não é realmente

00:22:55usável para a pessoa comum, já estou usando uso extra para ele, ah sim, o Copilot, eu nem mencionei

00:23:00o Copilot, esqueci que essa coisa estava até aqui, provavelmente fala por si mesmo, o Copilot, você o usa quando

00:23:06você é forçado a usar, ninguém está usando isso por conta própria, há alguns argumentos a serem feitos de que é decente

00:23:11em, tipo, tudo bem, é integrado à própria empresa, então, hum, nível C, recebo nota C menos

00:23:21não sei, o fato de eu ter até esquecido de mencioná-lo provavelmente diz muito, agora o Cling

00:23:263.0, se você não sabe o que é o Cling 3.0, é um modelo de vídeo e é um sólido nível A, coisas realmente, realmente

00:23:33boas, sua concorrência direta é o Veo 3, bem, Veo 3.1 atualmente, que eu colocaria no nível B, está

00:23:40meio que ficando ultrapassado a esta altura e é muito caro, que é a outra coisa, hum, e

00:23:47então temos o Seedance 2.0, se você viu algum vídeo de IA ultimamente, foi o Seedance, lembra de todos

00:23:53aqueles vídeos de um mês atrás, quando era tipo, beta incorporado de todas as coisas, como atores e

00:23:59cenas de filmes sendo recriadas, isso era o Seedance, e o Seedance é ótimo, definitivamente um passo à frente do

00:24:04Veo e do Cling, os visuais são selvagens, é selvagem e surpreendentemente não é tão caro comparativamente

00:24:11e então temos nossos modelos de imagem, o Nano Banana Pro é nível S, tem sido o melhor da categoria e o melhor da categoria

00:24:20há um tempo, e então também temos o novo Image Gen 2 do GPT, agora, pelo pouco que brinquei

00:24:28com ele, e isso acabou de sair, eu o colocaria no nível S, mas não usei o suficiente e não vi

00:24:34o suficiente de casos extremos, então este é um daqueles cenários em que, sabe, se você está otimista com ele, nível S

00:24:42se você quiser esperar para ver, é pelo menos nível A, então vamos mantê-lo no nível A por enquanto, veremos

00:24:49como ele se mantém, hum, mas dito isso, um ótimo modelo de imagem é um grande benefício para o ChatGPT, porque

00:24:56toneladas de pessoas usam isso, toneladas de pessoas usam o Image Gen, e um dos grandes diferenciais do Gemini

00:25:01versus ChatGPT sempre foram seus modelos de imagem superiores, então aqui é onde chegamos, espero que isso esclareça

00:25:09alguma luz sobre o que você deve focar e o que realmente não vale o seu tempo, e espero que

00:25:15ele tenha até trazido algumas ferramentas de IA novas que você nunca ouviu falar e que pode querer conferir, os grandes

00:25:20players, não acho que você deva se surpreender, coisas como Claude Code e Codex têm dominado

00:25:24há um tempo, mas, mais importante, eu diria para ficar longe de coisas do nível C para baixo, sabe, com

00:25:30certas exceções, como falamos sobre quando se trata do chatbot do Claude, acho que você pode muito facilmente

00:25:36se perder nos detalhes e perder uma tonelada de dinheiro, especialmente nessas coisas como Hermes e Open

00:25:40Claw, quanto mais coisas como Lovable, invista seu tempo nessas ferramentas de nível A e nível S que realmente vão

00:25:47lhe dar um retorno, e acho que isso realmente vale para o Claude Code, o Codex e o Anti-Gravity também, nesse

00:25:53aspecto, e que se você se tornar proficiente nessas ferramentas, você se tornou proficiente nelas porque se tornou

00:25:59proficiente nos fundamentos da construção com IA, então se na próxima semana o Claude Code cair de um penhasco e

00:26:05o Codex cair de um penhasco e algum outro "harness" se tornar, sabe, nível S e aquele que todos estão

00:26:10usando, bem, essas são habilidades transferíveis, essas são habilidades transferíveis que não estão ligadas a uma plataforma específica

00:26:15em um conjunto de ferramentas específico, você aprendeu a construir, você aprendeu os fundamentos

00:26:20da arquitetura de software e isso é importante, e é isso que, no final das contas, você deve buscar

00:26:25então espero que tenha gostado do vídeo, me diga o que achou, como sempre, confira o Chase AI Plus

00:26:31se quiser colocar as mãos na minha masterclass de Claude Code, e a gente se vê por aí

Key Takeaway

Foque em dominar as habilidades fundamentais de construção de software com agentes como Claude Code ou CodeX, pois ferramentas focadas em conveniência ou “teatro de produtividade” como Lovable e OpenClaw tornaram-se obsoletas em 2026.

Highlights

O Claude Code e o CodeX da OpenAI são classificados como ferramentas de nível S, essencialmente consolidando-se como padrões da indústria para agentes de codificação.
O Gemini supera o Claude e o ChatGPT como companheiro diário para o usuário comum devido à sua capacidade superior de analisar vídeos e integrar geração de imagens e vídeos por 20 dólares mensais.
O Claude Code reduz o custo de tokens em aproximadamente 90% em comparação ao uso direto das APIs do modelo Opus 4.7.
Ferramentas como OpenClaw, Hermes e Paperclip são classificadas como nível C ou D por oferecerem apenas “teatro de produtividade” sem oferecer avanços reais que não possam ser alcançados com agentes de codificação nativos.
O Lovable e o Bolt caíram para o nível D, perdendo relevância devido à alta complexidade técnica que não justifica mais o custo em comparação aos agentes de codificação modernos.
O NotebookLM é o produto de IA de uso único mais eficiente disponível, especialmente para pesquisas baseadas em vídeos do YouTube, com custo zero.
O Design by Claude oferece recursos de UI/UX superiores, mas seu consumo de tokens é classificado como nível D, tornando-o inviável para o usuário médio no momento.

Timeline

Chatbots e Companheiros Diários

O ChatGPT funciona como um chatbot mediano que gera respostas genéricas se o usuário não for habilidoso com prompts.
O Gemini ocupa o nível A por oferecer o melhor pacote para usuários comuns, incluindo geração de imagens, vídeos e análise de conteúdo multimídia.
O Claude é nível C no plano de 20 dólares devido a limites de uso rígidos, mas alcança o nível S para usuários profissionais com planos de 100 a 200 dólares.
O Grok é limitado a nível C para o usuário médio, servindo quase exclusivamente para usuários intensivos do Twitter.

A avaliação dos chatbots baseia-se na entrega de valor pelo preço mensal de 20 dólares. O Gemini destaca-se pela sua capacidade única de processar vídeos diretamente, superando os concorrentes nesse aspecto. O Claude, embora possua o melhor modelo (Opus 4.7), frustra usuários de planos básicos devido aos limites de uso severos, tornando-se uma ferramenta de alto nível apenas em planos empresariais superiores.

Agentes de Codificação e Harnesses

O Claude Code é nível S por ser um padrão da indústria que otimiza significativamente o consumo de tokens.
O CodeX da OpenAI é uma alternativa de nível S ao Claude Code, oferecendo vantagens em limites de uso e performance em complexidade extrema.
O Anti-Gravity caiu para o nível A, perdendo competitividade frente ao uso direto de modelos nativos.
OpenClaw e Hermes são classificados como nível C/D por representarem teatro de produtividade com alto custo e pouca entrega prática.

Agentes de codificação foram avaliados pela sua eficácia real em projetos de desenvolvimento. O Claude Code e o CodeX dominam o espaço, enquanto ferramentas como OpenClaw são criticadas por criar uma ilusão de trabalho (dashboards e automações visuais) sem superar a eficiência dos agentes de codificação diretos.

Construtores No-Code e Ferramentas Especializadas

Lovable e Bolt são classificados como nível D por não justificarem o custo perante a eficácia dos novos agentes de codificação.
O N8N tornou-se uma ferramenta de nicho para clientes não técnicos, embora ferramentas como Make e Zapier sejam consideradas nível D.
O NotebookLM é nível S por ser a melhor ferramenta de pesquisa gratuita disponível, permitindo a análise de múltiplos vídeos.
O Perplexity caiu para o nível C por ser um custo adicional pouco justificado para a maioria dos usuários que já utilizam outros chatbots.

A categoria de no-code sofreu uma queda drástica de valor conforme os agentes de codificação ficaram mais acessíveis e capazes. Ferramentas como o Lovable, que antes entregavam valor, hoje cobram um prêmio pela conveniência que não supera a capacidade técnica dos novos agentes. O NotebookLM destaca-se como a exceção de alto valor, sendo indispensável para pesquisa.

Criação de Conteúdo e Modelos de Imagem/Vídeo

O Design by Claude é nível B, equilibrando um desempenho visual excelente com um consumo de tokens insustentável.
O Seedance 2.0 supera concorrentes como Cling e Veo em qualidade visual e custo-benefício.
Nano Banana Pro e o novo Image Gen 2 do GPT são classificados como nível S e A, respectivamente, para geração de imagens.

Ferramentas de criação foram avaliadas pelo equilíbrio entre qualidade de saída e custo de uso. O Design by Claude exemplifica o problema do alto consumo de tokens em ferramentas de interface, enquanto o Seedance 2.0 lidera o espaço de vídeo pela sua qualidade superior e custo acessível.

Community Posts

Write about this video