Classificando Todas as Ferramentas de IA que usei em 2026 (O que REALMENTE funciona)

CChase AI
컴퓨터/소프트웨어창업/스타트업경영/리더십AI/미래기술

Transcript

00:00:00Existem ferramentas de IA demais em 2026, e tornou-se impossível descobrir
00:00:05quais realmente valem o seu tempo e dinheiro. E como não tenho nada melhor para fazer,
00:00:10testei uma tonelada delas nos últimos meses. E hoje vou classificar todas
00:00:15elas. Vou cobrir tudo, desde chatbots básicos até agentes de codificação completos e
00:00:20tudo o que há entre eles. Então, no final deste vídeo, você saberá em quais deve realmente focar.
00:00:27Então, vamos classificar isso usando o formato padrão de lista de níveis (tier list). O nível S é o melhor,
00:00:32o nível D é o pior, e todas essas ferramentas serão agrupadas com base em suas funções.
00:00:36Agora, quando se trata de avaliar uma ferramenta específica, vamos analisá-la sob duas lentes. Uma é: como
00:00:42ela se classifica em relação às outras ferramentas da sua categoria? Então, como o N8N se compara a outras ferramentas de automação no-code
00:00:49como Make ou Zapier? Mas também daremos uma olhada no nível macro, porque você pode ser
00:00:56o melhor da categoria em algo como automação no-code. Mas isso significa que você é automaticamente nível S
00:01:00só porque superou todos na sua categoria? Não necessariamente, porque tudo isso está interligado.
00:01:05Essas ferramentas funcionam em conjunto. O que era ótimo há seis meses pode estar tendo problemas
00:01:11hoje. Então, quando eu classificar suas ferramentas favoritas no nível D, certifique-se de deixar um comentário e me dizer
00:01:14o quanto você odeia meus critérios de avaliação subjetivos e muito vagos. Vou me certificar de manter isso em mente na próxima
00:01:20vez. Então, vamos começar com os chatbots. E o primeiro que vamos classificar é o ChatGPT. Agora,
00:01:26é aqui que muitos de nós começamos. E, pelos números, a maioria das pessoas ainda está aqui.
00:01:31Em um nível macro, o ChatGPT está definitivamente subindo no meu ranking porque seus modelos
00:01:35são muito sólidos. O 5.4 é um ótimo modelo. No entanto, quando falamos sobre o chatbot em si,
00:01:40eu fico com uma sensação de "meh", é bom. Ele se tornou o chatbot mediano por excelência.
00:01:47Você não vai odiar as saídas. Você não vai amar as saídas. E, infelizmente,
00:01:51se você for ruim em fazer prompts, terá respostas muito genéricas. Todos nós já sabemos reconhecer
00:01:56a escrita do ChatGPT a esta altura. Mas, por 20 dólares por mês, consigo tirar muito proveito dele. E tem alguns
00:02:00extras, como geração de imagens. E o novo modelo de geração de imagens é realmente muito bom.
00:02:04E por falar em geração de imagens, vamos falar de outro chatbot. E esse é o Gemini. Agora, o Gemini,
00:02:10já vou te dizer logo de cara: nível A. Acho que, se você for apenas o tipo de pessoa que vai
00:02:15gastar 20 dólares por mês em um chatbot de IA, você só quer um companheiro diário. O Gemini é sua melhor aposta de longe.
00:02:21É melhor que o Claude nesse aspecto. E o que quero dizer com isso? Você vai obter proveito suficiente
00:02:25dele como uma pessoa comum. Além disso, o Gemini me oferece geração de imagens
00:02:31e o Nano Banana Pro é o melhor da categoria. Posso obter geração de vídeo. E, importantemente, o que ele faz melhor
00:02:36do que qualquer outro modelo de chat é lidar com os vídeos em si. Posso dar ao Gemini vídeos do YouTube. Posso dar a ele
00:02:42vídeos de formato curto, Reels, TikToks, o que for, e ele consegue realmente analisar. Os outros
00:02:46realmente sofrem nesse departamento ou não conseguem fazer isso de jeito nenhum. Agora, no vácuo, eu acho que o 3.1 é
00:02:50melhor que o 5.4 ou o Opus, como vamos falar? Não. Mas acho que, holisticamente, por 20 dólares por
00:02:55mês, como companheiro diário, você deveria estar usando o Gemini. E então vem a Anthropic. Então, onde colocamos o Claude?
00:03:00Isso é difícil, porque quando falamos sobre o Claude e o Opus 4.7, o Opus 4.7 é o melhor modelo no
00:03:08jogo agora, pelo menos na minha opinião. E eu acho que a Anthropic é a melhor entre os
00:03:12três principais players. No entanto, se estivermos falando puramente do chatbot e você estiver em um plano de 20 dólares por mês,
00:03:18você poderia argumentar que é nível C. Puramente, puramente baseado nos problemas de uso. Se você está em um plano de 20 dólares por
00:03:26mês e está tentando usar o Opus para qualquer projeto real ou fazer com que ele realmente gere
00:03:31qualquer coisa, você vai bater na parede tão rápido que vai se perguntar: o que estou fazendo?
00:03:35Porque, por 20 dólares por mês, provavelmente consigo uma saída que é uma solução de 95% e posso
00:03:41fazer isso um milhão de vezes. Enquanto isso, a Anthropic limita seu uso muito fortemente se você
00:03:45não estiver em um plano de 100 ou 200 dólares por mês. Além disso, quando se trata de coisas como o Sonnet e o Opus,
00:03:50tudo o que ele pode fazer é texto, código e esses artefatos. Não posso fazer imagens. Não posso fazer vídeos. É apenas texto.
00:03:58Então, se você é o usuário médio de IA que está apenas usando um chatbot, eu diria que é nível C.
00:04:05No entanto, se você estiver em um plano de 100 ou 200 dólares por mês, é nível S. A menos que você esteja tentando
00:04:14fazer coisas como vídeos ou imagens. Então, quando se trata do Claude, é muito dependente do caso de uso e muito
00:04:20dependente do uso. Então, para o cara comum que vem da rua, que só quer saber em qual IA deve gastar
00:04:2520 dólares por mês: nível C. Mas se você leva isso a sério, tem um plano de 100 ou 200 dólares por mês: nível S.
00:04:31E então houve o Grok. Onde colocamos o Grok? Bem, ele é pior que todos esses em tarefas de codificação.
00:04:37Ele tem um modelo de imagem muito pior que o ChatGPT ou o Gemini. Seu modelo de vídeo é pior que o do Gemini
00:04:44e, na verdade, tudo o que ele tem a seu favor são menos travas de segurança e é muito bom logo de cara
00:04:50em termos de descobrir o que está acontecendo no mundo real naquele exato momento.
00:04:55Então, é ótimo se você é "viciado em Twitter", talvez se você for, seja nível B+. Para
00:05:00o usuário médio, nível C. Para ser totalmente honesto com você. E quando falamos, ah, ele é ótimo em
00:05:06lidar com vídeo, tipo, posso alimentá-lo com um post do Twitter, ele sabe o que está acontecendo. Novamente, se você estiver
00:05:10hiperfocado na funcionalidade do Twitter, claro. Talvez nível A. Para o usuário médio, nível C, na melhor das hipóteses. Você
00:05:17nunca recomendaria isso para alguém que não passa quatro horas por dia no Twitter. Agora, antes de pularmos
00:05:21para o ranking dos agentes de codificação, só quero fazer um rápido merchan da minha masterclass de Claude Code.
00:05:26Ela foi lançada no mês passado e é a maneira número um de ir do zero ao desenvolvedor de IA, especialmente se
00:05:31você não vem de uma formação técnica. Eu a atualizo toda semana e, ultimamente, temos realmente
00:05:35focado em como construir um SO agente que é alimentado pelo Claude Code e traz coisas como
00:05:42Obsidian para memória e GWS para conectá-lo a coisas como o Google Suite. Então, se você tiver interesse
00:05:48nisso, pode encontrar dentro do Chase AI Plus; haverá um link no comentário fixado. Então é isso para
00:05:52os chatbots. Agora vamos passar para os agentes de codificação ou "harnesses" de codificação como o CodeX e
00:05:57o Claude Code. E, falando em Claude Code, esse será o primeiro que discutiremos agora. O Claude Code é nível S
00:06:03para mim. No entanto, é o mesmo tipo de conversa de antes. O que estamos discutindo em termos de
00:06:10uso? Se você acha que pode aparecer no Claude Code com um plano de 20 dólares por mês e obter qualquer coisa dele,
00:06:15você está enganado. Vou mantê-lo no nível S aqui porque, se você está usando o Claude Code
00:06:19e leva a sério a construção, você vai ter um plano de 100 dólares por mês, no mínimo,
00:06:24ou 200 dólares por mês. E podemos ficar aqui reclamando sobre os usos e tudo isso,
00:06:29mas o fato permanece que há uma razão para isso ter se tornado essencialmente um padrão da indústria.
00:06:33Ele é bom. E você precisa lembrar que, mesmo no preço de 100 ou 200 dólares por mês,
00:06:38você ainda obtém uma redução de cerca de 90% no que seu uso normal de tokens custaria se você estivesse usando
00:06:44as APIs para algo como o Opus 4.7. Agora, existe um contingente muito barulhento de pessoas que dirá:
00:06:50Ei, o Claude Code foi "nerfado". O Opus 4.6 foi "nerfado". Há problemas com o 4.7. Sim.
00:06:55Mas acho que isso tem muito mais a ver com as realidades da discussão online sobre qualquer ferramenta
00:07:02que se torna popular. E, francamente, mais com falta de habilidade do que com alguma trama secreta para "nerfar"
00:07:08o Claude Code. No entanto, só porque o Claude Code é nível S, isso não significa que é o único jogo na
00:07:12cidade, porque se você realmente é da opinião de que a Anthropic está indo ladeira abaixo e esses lançamentos do Opus 4.6 e
00:07:194.7 foram abaixo do padrão, bem, você tem opções, nomeadamente o CodeX, que é o da OpenAI, você sabe,
00:07:26o fabricante da versão do ChatGPT do Claude Code. E eu vou te dizer agora que é nível S também. E
00:07:31tem algumas vantagens sérias sobre o Claude Code. A principal delas é o uso. Consigo obter muito mais
00:07:38tokens do CodeX do que do Claude Code. Além disso, os modelos da OpenAI são bons. O que quer que
00:07:45você esteja fazendo com o Opus 4.6 ou 4.7 pode ser feito com o GPT 5.4, talvez nas margens. E estamos falando
00:07:52de complexidade extrema. Você pode argumentar a favor de um ou de outro, e haverá toneladas de pessoas que
00:07:56argumentarão a favor dos modelos da OpenAI em relação aos modelos da Anthropic, mas para 99% das pessoas, realmente não
00:08:02haverá uma enorme diferença. E então, quando a questão é: "deveria ser Claude Code ou deveríamos usar
00:08:07CodeX?", a resposta é simplesmente escolher um. Qual é a sua preferência pessoal? Agora, o que dizer de algo
00:08:12como o Anti-Gravity, que desempenha o papel de "harness"/IDE, meio que, ainda no espaço
00:08:18ainda. Onde isso vai? Bem, não muito tempo atrás, eu o teria colocado no nível S e dito que havia meio que
00:08:21esse triunvirato aqui em cima desses agentes de codificação, mas hoje em dia eu o colocaria no nível A. A verdade
00:08:27é que o Anti-Gravity, quando usado com outros modelos do Google como o Gemini 3.1, simplesmente não é tão bom
00:08:32quando se trata do Claude Code com Opus ou CodeX com algo como o 5.4, você estaria melhor usando
00:08:39o Anti-Gravity com esses outros modelos, o que então levanta a questão: por que usar o shell
00:08:44Anti-Gravity ao redor dele para começar? Por que não apenas usar algo como o Claude Code ou a OpenAI com seus
00:08:49modelos nativos para os quais ele foi realmente construído? Além disso, você está começando a ver algumas pessoas reclamarem
00:08:52sobre problemas de uso com o Anti-Gravity também. Quando, quando ele surgiu, eles praticamente te davam
00:08:58uso total de graça para sempre, era o que parecia. Agora, a próxima ferramenta da qual vamos falar não é realmente um
00:09:03agente de codificação ou "harness" ainda, é frequentemente falada com esses outros, então vamos incluí-la
00:09:07aqui, e esse é o OpenClaw. Agora, tenho sido bastante vocal no passado sobre minha aversão ao OpenClaw
00:09:12e, para ser honesto, isso não mudou. Eu o colocaria como nível C e, discutivelmente, nível D. O OpenClaw
00:09:18é teatro de performance. Quando você está usando o OpenClaw, parece que muita coisa está acontecendo. Estamos fazendo
00:09:23dashboards, estamos conectando coisas, ele tem um batimento cardíaco, ele está falando comigo. Há muito
00:09:28movimento acontecendo, mas não há muito avanço. Você sente que está fazendo coisas e, para
00:09:32muitas pessoas, isso é o suficiente, mas o fato é: quatro meses depois, três meses depois, e isso
00:09:39ainda será o caso daqui a três anos. Ainda estou esperando alguém vir e me dizer: "oh, aqui está
00:09:44esse caso de uso do OpenClaw que eu faço e que não pode ser feito dentro do Claude Code ou CodeX e que não pode ser feito
00:09:52com mais eficiência pelo Claude Code ou CodeX?". E se você me disser que é um relatório matinal ou algum tipo de
00:09:57briefing, vou banir você do canal. E esse ranking baixo do OpenClaw só ficou mais
00:10:02óbvio desde que a Anthropic veio a público e disse que você não pode usar sua assinatura Max dentro do OpenClaw,
00:10:10o que significa que você precisa pagar preços de API para algo como o Opus 4.7. Agora, ressalva: literalmente hoje, algo
00:10:16saiu onde eles estão tipo, "ah não, uh, está nos docs do OpenClaw onde diz que conversamos com alguém
00:10:21da equipe da Anthropic e eles disseram que está tudo bem agora". Eu sinto que precisamos de um pouco mais de prova do que
00:10:28alguma linha única na documentação deles dizendo que falamos com um cara. Então, até que isso seja confirmado, é
00:10:36loucura pensar que o OpenClaw é algum tipo de substituto do Claude Code, e eu entendo que eles não são
00:10:40a mesma coisa, ainda assim, as pessoas usarão isso em vez do outro, ou dirão: "oh não, meu OpenClaw chama o Claude Code
00:10:46para fazer coisas". Por quê? Por que não chamar o Claude Code você mesmo? E vou encerrar essa discussão aqui
00:10:52mas OpenClaw, e basicamente a mesma coisa com o Hermes, certo? Acho que o Hermes é um pouco
00:10:59melhor, mas vou colocá-lo em um nível C sólido. Isso é apenas teatro de produtividade. Parece que estamos fazendo
00:11:06muito, mas você pode fazer tudo isso dentro de um agente de codificação real, você simplesmente pode. Agora, o Hermes meio que tem
00:11:12algumas coisas inteligentes acontecendo com, você sabe, essas habilidades de autoatualização, mas a coisa das habilidades de
00:11:18autoatualização também chega muito perto dessa ilusão de que algo bom está acontecendo, onde é tipo, "oh não,
00:11:25a cada 15 chamadas de ferramenta, ele está dando uma olhada em suas habilidades e reescrevendo-as". Ele precisa?
00:11:29Como estamos determinando que essa nova está realmente funcionando? Por que eu não usaria o Claude Code e usaria
00:11:36algo como a habilidade de criador de habilidades para dar uma olhada nas habilidades que tenho usado regularmente ou, eu
00:11:40não sei, olhar as saídas eu mesmo e determinar se precisamos fazer isso? Então, esse tipo de
00:11:46ferramenta, você também poderia jogar algo como o Paperclip aqui; muito acontecendo, nada acontecendo.
00:11:53Agora, você notará que não estou cobrindo alguns outros "harnesses" de codificação populares, coisas como
00:11:58o OpenCode. A verdade é que simplesmente não os usei muito, não sinto que posso falar
00:12:01inteligentemente sobre eles, e isso se torna, eu acho, uma discussão que entra na rota do modelo
00:12:08de código aberto, a qual eu acho que é um caminho inteiro à parte. Acho que se você está profundamente na rota
00:12:15de código aberto, você meio que já sabe o que está fazendo, porque a pessoa média não
00:12:21vai estar tocando nisso, nem tem o hardware para fazer isso em qualquer nível. Dito
00:12:25isso, ouvi apenas coisas boas sobre coisas como o OpenCode e o Pi, então se você gosta, continue
00:12:29fazendo isso. Agora, vamos passar para alguns desses construtores no-code, coisas como o Lovable e o N8N. E eu entendo que
00:12:36existe alguma delineação aí entre coisas orientadas a automação como o N8N e o Lovable, mas vamos
00:12:40avaliar todos eles sob um mesmo guarda-chuva. Então, o primeiro é o Lovable. O Lovable, se você me fizer
00:12:48essa pergunta, você sabe, há nove meses, Lovable, eu o teria colocado no nível S. Eu amava o Lovable quando ele
00:12:56saiu, ele praticamente pegou aquela base do que era, o quê, Sonnet 3.5 na época, Opus
00:13:023 na época, e realmente o ajustou para lhe dar um ótimo design de front-end, e embora fosse meio
00:13:08caro, não parecia loucura. Agora, o Lovable, é tipo, qual é o sentido? Qual é o sentido? O
00:13:16Lovable, o Lovable vai estar por aí em um ano, dois anos? Quando você sugeriria a alguém usar o Lovable?
00:13:27Tipo, não há sentido, não há sentido quando o CodeX existe, quando o Claude Code existe, quando até alguns desses
00:13:33chatbots existem. Você está pagando um prêmio insano para ter uma configuração Superbase de um clique
00:13:40ou um deploy de um clique, e esses outros sistemas tornaram-se tão bons, especialmente coisas como o
00:13:47Claude Code, criando designs de front-end que são tão bons quanto o que o Lovable produz, que é tipo:
00:13:52pelo que você está pagando o preço? Pela conveniência? Porque quanto você está disposto a pagar
00:13:57por mês por conveniência? Porque é um prêmio insano, e em um certo ponto a conveniência
00:14:01não importa, porque se você está construindo um aplicativo real, existe algum tipo de complexidade técnica ou
00:14:06pelo menos obstáculos que você terá que navegar não importa o quê, e se você pudesse fazer isso, você poderia
00:14:11fazer isso nesses, você poderia fazer isso no Anti-Gravity. Então, tipo, o Lovable não é um produto ruim de forma alguma, mas
00:14:17quando você o compara à concorrência e ao ecossistema em geral, é difícil justificar sua
00:14:23existência. Quero dizer, alguém está recomendando o Lovable hoje em dia? Eu certamente não estou. E isso se aplica ao
00:14:29Bolt também, que é apenas, a esta altura, outra versão do Lovable. Lembra quando o Bolt surgiu pela primeira vez?
00:14:33Foi tipo selvagem, tipo: "oh meu Deus, essa coisa está criando um aplicativo do zero", e o que estamos,
00:14:38um ano e meio depois, estou tipo: ah, nível D, nunca recomendaria. Eles estão tipo: este é um espaço
00:14:43morto. E quando não tenho coisas como o Base 44 e esses tipos de coisas, como o Replit,
00:14:49tipo, acho que é para onde eles estão indo também. Não os usei o suficiente para dar uma ótima resposta
00:14:53mas, novamente, acho que quando você olha para o futuro e vê a si mesmo competindo
00:14:59contra o Claude Code, o CodeX e o Anti-Gravity, eles só vão ficar mais fáceis de usar. Quero dizer,
00:15:05olhe para coisas como Co-Work, vai ficar mais fácil de usar. E você, o zeitgeist cultural
00:15:11aqui é: Claude, Claude, Claude, Claude. Tipo, se você é Replit, se você é Base 44, certamente se você é Bolt ou Lovable,
00:15:17que chance você tem a longo prazo? Não acho que pareça ótimo. Agora, o Cursor é um interessante
00:15:22porque pode ser usado em combinação com o Claude Code e o CodeX. E eu fiz isso por muito
00:15:27tempo, eu essencialmente usei o Cursor como meu IDE, como meu VS Code com esteroides, e usei o Claude Code
00:15:34e a ideia era: ok, o Claude Code vai fazer 99% do trabalho, mas se eu quiser fazer uma verificação cruzada
00:15:39do trabalho, bem, estou dentro do Cursor, então você sabe, eu poderia ter um GPT 5.4 dando uma olhada diretamente no
00:15:46trabalho que o Claude Code fez e dizer: ei, isso foi bom, isso foi ruim. Era um segundo par de olhos muito fácil de usar.
00:15:52Hoje em dia, o que precisamos disso? Bem, em primeiro lugar, você certamente não precisa, porque posso usar o CodeX dentro
00:16:02do Claude Code. Existe um plugin que podemos usar e podemos fazer uma revisão de código, revisão de código adversária.
00:16:08Então, esse caso de uso específico está fora de questão. Nós amamos o Composer 2.0? Talvez você ame, se esse for o
00:16:15caso e você ama o Composer, talvez seja nível A, talvez seja meio como no espaço do Anti-Gravity, mas para
00:16:21mim hoje em dia, eu diria que é nível B, tipo, não é um produto ruim de forma alguma, não me entenda mal, não estou dizendo
00:16:25que você não deveria usar o Cursor. Acho que é um ótimo produto. É apenas, novamente, quem é o cliente
00:16:30do Cursor e por que eles estão escolhendo o Cursor em vez desses outros caras? Acho que é um passo
00:16:37distante de todo aquele problema do Lovable. E provavelmente deveria ter falado sobre esses caras
00:16:41na última seção, mas o Gemini CLI. Nomeie 10 pessoas que usam o Gemini CLI que não trabalham para o Google.
00:16:47Entendeu? Acho que, por virtude de estar literalmente ausente da discussão e, novamente, alguém
00:16:55realmente usa isso? Se a resposta for não, provavelmente há uma razão para isso. Eu literalmente não
00:16:59conheço uma única pessoa que usa o Gemini CLI ou afirmou usá-lo e que, literalmente, não seja um
00:17:04funcionário do Google, e acho que isso diz muito. Agora, quanto ao N8N, oh, eu fui um super fã do N8N por
00:17:11muito tempo, então isso era um nível S automático por muito, muito tempo. Hoje em dia, o N8N foi de "essa é
00:17:18a ferramenta ideal que você deve usar para criar agentes de IA e automações sem usar código" para uma ferramenta
00:17:26muito de nicho, porque vamos ser honestos, tudo o que o N8N pode fazer, o Claude Code pode fazer, tudo o que o N8N pode fazer, o CodeX pode
00:17:33fazer, e se você é uma ferramenta onde posso dizer que tudo o que você faz o Claude Code ou o CodeX pode fazer, é melhor haver um
00:17:40motivo muito convincente ou um diferencial convincente, seja facilidade de uso, custo, nicho, para justificar
00:17:48sua existência. Para o N8N, ele ainda tem isso, e acho que é o nicho e a facilidade de uso, mas eu só
00:17:55uso o N8N hoje em dia para projetos de clientes se for um projeto de cliente para uma equipe muito não técnica onde,
00:18:01por qualquer motivo, eles também precisam ser práticos, então, em algum momento, precisarão da capacidade
00:18:06de entrar na automação e talvez ajustar uma ou duas coisas. O N8N torna isso muito fácil de fazer, a
00:18:11configuração visual é ótima. Mas, quero dizer, novamente, a facilidade de uso agora está se tornando o diferencial do N8N, não é
00:18:19porque é muito mais rápido, quer seja do que o Claude Code... posso configurar, posso configurar, posso configurar
00:18:27automações N8N mais rápido dentro do Claude Code do que posso fazer através do próprio N8N. Isso é meio que um
00:18:32problema para a viabilidade a longo prazo, eu acho. Quero dizer, então foi de, eu acho, meio que onipresente nesse
00:18:39espaço de IA no-code para, talvez, se você precisar por um motivo específico e precisar de alguma justificativa
00:18:45para fazê-lo. Mas, tipo, o produto em si não mudou, ele ainda faz o que faz muito bem, mas a concorrência direta
00:18:50do N8N, como Make e Zapier, nível D: mais caro, menos flexibilidade, para que se preocupar? Então, novamente,
00:19:00qual é o seu diferencial? Se você não pode fazer isso, você vai morrer. Então não sei por que alguém usaria
00:19:04o por que alguém usaria o Make ou Zapier a esta altura, além de razões legadas, e vamos trazer alguns dos retardatários
00:19:09a esta altura, o NotebookLM, onde o NotebookLM se encaixa? É quase como uma ferramenta de IA de nicho, como
00:19:15não é um agente de codificação, não é realmente algo de não código, embora haja um argumento a ser feito de que
00:19:20ele é, certo? Se eu puder dar um comando e dar contexto, ele cria coisas para mim, então mais ou menos
00:19:25dito isso, o NotebookLM é incrível e é nível S, com certeza, para uma ferramenta de IA de uso único, eu acho
00:19:33o NotebookLM é o melhor que existe, acho que é o melhor produto do Google, para ser franco, e o
00:19:38fato de que posso integrá-lo dentro do Claude Code, certamente posso integrá-lo com o Anti-Gravity usando
00:19:43coisas como o NotebookLM pi CLI, é um impulso de produtividade tão gigante e o Google permite que você faça
00:19:50tanto nele de graça, o que é incrível, e você pode criar entregáveis muito bons, coisas como
00:19:55apresentações de slides, infográficos, e é a melhor maneira, na minha opinião, de fazer qualquer tipo de pesquisa que
00:20:01envolva muitos vídeos do YouTube, então fiz muito conteúdo combinando o Claude Code e o NotebookLM
00:20:07por um ótimo motivo, porque o NotebookLM é incrível, é gratuito, outro que não mencionamos, talvez
00:20:13deveríamos ter mencionado nos chatbots, o Perplexity, agora o Perplexity é um chatbot, ainda assim, será que alguém está usando
00:20:20o Perplexity como seu único chatbot autônomo? Talvez, talvez o argumento hoje em dia com o Perplexity seja
00:20:26que é o chatbot que permite usar vários outros chatbots, mas por muito tempo foi nível S para mim
00:20:34e, novamente, como tantas ferramentas, está começando a cair, hoje em dia eu colocaria o Perplexity no nível C
00:20:40e talvez isso se deva em grande parte ao fato de eu não ser um usuário das ferramentas periféricas do Perplexity, como
00:20:47o Computer ou Comet, seu navegador, e por causa disso, percebo que só uso o Perplexity
00:20:53e estou no plano Pro, eu realmente uso o Perplexity quando penso: "Tudo bem, só quero obter
00:20:58informações sobre algo que aconteceu hoje e quero as fontes, e não quero ter que
00:21:03fazer comandos abertos ao Claude ou ChatGPT para fazer uma busca na web para obter esses dados reais", então, de certa forma,
00:21:10é quase como o Grok com esteroides, onde ele é muito bom em buscar na web e é feito para
00:21:16fazer isso, mas, novamente, é uma ferramenta para o dia a dia? Não. Vale a pena pagar 20 dólares por mês além dessas outras
00:21:22ferramentas? Não, é algo "bom de ter", é algo "bom de ter", e em nossa última categoria vamos falar
00:21:28sobre algumas dessas ferramentas de criação de conteúdo, geradores de imagem, geradores de vídeo, esse tipo de coisa, agora
00:21:33o primeiro da lista é um produto recente, e é o Design by Claude, agora, no vácuo, eu o colocaria no
00:21:42nível S, eu absolutamente amo o Design, você sabe, venho usando muito nestes últimos dias e é um enorme
00:21:49passo à frente do Claude Code básico e também é um enorme passo à frente da maioria das habilidades que vemos por
00:21:55aí, coisas como, bem, certamente a habilidade de design de front-end, a habilidade de UI/UX Pro supera isso
00:22:00com folga, e logo de cara, ele faz um ótimo, ótimo trabalho permitindo que você muito rapidamente
00:22:05itere através de um monte de visuais, no entanto, vírgula, o uso é a pior coisa que já vi na minha
00:22:12vida, você o consome a uma taxa insana, não ganho uso extra mesmo pagando 200 dólares
00:22:18por mês, tenho o mesmo uso de alguém no plano Pro, por quê? E não está muito claro o que
00:22:23consome tudo isso, embora, depois de fazer alguns experimentos, depois que você esgota tudo,
00:22:26torna-se muito óbvio, criar um sistema de design pode consumir 30% dos seus tokens, pedir uma página de destino simples
00:22:32pode consumir cerca de 5% dos seus tokens, então o uso é difícil, no vácuo é nível S, o uso é nível D
00:22:39então acho que, no final das contas, um nível B meio que divide a diferença, ótima ferramenta, uma vez que
00:22:50eles ajustarem o uso, será incrível, um dos melhores produtos, para ser honesto, mas agora não é realmente
00:22:55usável para a pessoa comum, já estou usando uso extra para ele, ah sim, o Copilot, eu nem mencionei
00:23:00o Copilot, esqueci que essa coisa estava até aqui, provavelmente fala por si mesmo, o Copilot, você o usa quando
00:23:06você é forçado a usar, ninguém está usando isso por conta própria, há alguns argumentos a serem feitos de que é decente
00:23:11em, tipo, tudo bem, é integrado à própria empresa, então, hum, nível C, recebo nota C menos
00:23:21não sei, o fato de eu ter até esquecido de mencioná-lo provavelmente diz muito, agora o Cling
00:23:263.0, se você não sabe o que é o Cling 3.0, é um modelo de vídeo e é um sólido nível A, coisas realmente, realmente
00:23:33boas, sua concorrência direta é o Veo 3, bem, Veo 3.1 atualmente, que eu colocaria no nível B, está
00:23:40meio que ficando ultrapassado a esta altura e é muito caro, que é a outra coisa, hum, e
00:23:47então temos o Seedance 2.0, se você viu algum vídeo de IA ultimamente, foi o Seedance, lembra de todos
00:23:53aqueles vídeos de um mês atrás, quando era tipo, beta incorporado de todas as coisas, como atores e
00:23:59cenas de filmes sendo recriadas, isso era o Seedance, e o Seedance é ótimo, definitivamente um passo à frente do
00:24:04Veo e do Cling, os visuais são selvagens, é selvagem e surpreendentemente não é tão caro comparativamente
00:24:11e então temos nossos modelos de imagem, o Nano Banana Pro é nível S, tem sido o melhor da categoria e o melhor da categoria
00:24:20há um tempo, e então também temos o novo Image Gen 2 do GPT, agora, pelo pouco que brinquei
00:24:28com ele, e isso acabou de sair, eu o colocaria no nível S, mas não usei o suficiente e não vi
00:24:34o suficiente de casos extremos, então este é um daqueles cenários em que, sabe, se você está otimista com ele, nível S
00:24:42se você quiser esperar para ver, é pelo menos nível A, então vamos mantê-lo no nível A por enquanto, veremos
00:24:49como ele se mantém, hum, mas dito isso, um ótimo modelo de imagem é um grande benefício para o ChatGPT, porque
00:24:56toneladas de pessoas usam isso, toneladas de pessoas usam o Image Gen, e um dos grandes diferenciais do Gemini
00:25:01versus ChatGPT sempre foram seus modelos de imagem superiores, então aqui é onde chegamos, espero que isso esclareça
00:25:09alguma luz sobre o que você deve focar e o que realmente não vale o seu tempo, e espero que
00:25:15ele tenha até trazido algumas ferramentas de IA novas que você nunca ouviu falar e que pode querer conferir, os grandes
00:25:20players, não acho que você deva se surpreender, coisas como Claude Code e Codex têm dominado
00:25:24há um tempo, mas, mais importante, eu diria para ficar longe de coisas do nível C para baixo, sabe, com
00:25:30certas exceções, como falamos sobre quando se trata do chatbot do Claude, acho que você pode muito facilmente
00:25:36se perder nos detalhes e perder uma tonelada de dinheiro, especialmente nessas coisas como Hermes e Open
00:25:40Claw, quanto mais coisas como Lovable, invista seu tempo nessas ferramentas de nível A e nível S que realmente vão
00:25:47lhe dar um retorno, e acho que isso realmente vale para o Claude Code, o Codex e o Anti-Gravity também, nesse
00:25:53aspecto, e que se você se tornar proficiente nessas ferramentas, você se tornou proficiente nelas porque se tornou
00:25:59proficiente nos fundamentos da construção com IA, então se na próxima semana o Claude Code cair de um penhasco e
00:26:05o Codex cair de um penhasco e algum outro "harness" se tornar, sabe, nível S e aquele que todos estão
00:26:10usando, bem, essas são habilidades transferíveis, essas são habilidades transferíveis que não estão ligadas a uma plataforma específica
00:26:15em um conjunto de ferramentas específico, você aprendeu a construir, você aprendeu os fundamentos
00:26:20da arquitetura de software e isso é importante, e é isso que, no final das contas, você deve buscar
00:26:25então espero que tenha gostado do vídeo, me diga o que achou, como sempre, confira o Chase AI Plus
00:26:31se quiser colocar as mãos na minha masterclass de Claude Code, e a gente se vê por aí

Key Takeaway

Foque em dominar as habilidades fundamentais de construção de software com agentes como Claude Code ou CodeX, pois ferramentas focadas em conveniência ou “teatro de produtividade” como Lovable e OpenClaw tornaram-se obsoletas em 2026.

Highlights

  • O Claude Code e o CodeX da OpenAI são classificados como ferramentas de nível S, essencialmente consolidando-se como padrões da indústria para agentes de codificação.

  • O Gemini supera o Claude e o ChatGPT como companheiro diário para o usuário comum devido à sua capacidade superior de analisar vídeos e integrar geração de imagens e vídeos por 20 dólares mensais.

  • O Claude Code reduz o custo de tokens em aproximadamente 90% em comparação ao uso direto das APIs do modelo Opus 4.7.

  • Ferramentas como OpenClaw, Hermes e Paperclip são classificadas como nível C ou D por oferecerem apenas “teatro de produtividade” sem oferecer avanços reais que não possam ser alcançados com agentes de codificação nativos.

  • O Lovable e o Bolt caíram para o nível D, perdendo relevância devido à alta complexidade técnica que não justifica mais o custo em comparação aos agentes de codificação modernos.

  • O NotebookLM é o produto de IA de uso único mais eficiente disponível, especialmente para pesquisas baseadas em vídeos do YouTube, com custo zero.

  • O Design by Claude oferece recursos de UI/UX superiores, mas seu consumo de tokens é classificado como nível D, tornando-o inviável para o usuário médio no momento.

Timeline

Chatbots e Companheiros Diários

  • O ChatGPT funciona como um chatbot mediano que gera respostas genéricas se o usuário não for habilidoso com prompts.
  • O Gemini ocupa o nível A por oferecer o melhor pacote para usuários comuns, incluindo geração de imagens, vídeos e análise de conteúdo multimídia.
  • O Claude é nível C no plano de 20 dólares devido a limites de uso rígidos, mas alcança o nível S para usuários profissionais com planos de 100 a 200 dólares.
  • O Grok é limitado a nível C para o usuário médio, servindo quase exclusivamente para usuários intensivos do Twitter.

A avaliação dos chatbots baseia-se na entrega de valor pelo preço mensal de 20 dólares. O Gemini destaca-se pela sua capacidade única de processar vídeos diretamente, superando os concorrentes nesse aspecto. O Claude, embora possua o melhor modelo (Opus 4.7), frustra usuários de planos básicos devido aos limites de uso severos, tornando-se uma ferramenta de alto nível apenas em planos empresariais superiores.

Agentes de Codificação e Harnesses

  • O Claude Code é nível S por ser um padrão da indústria que otimiza significativamente o consumo de tokens.
  • O CodeX da OpenAI é uma alternativa de nível S ao Claude Code, oferecendo vantagens em limites de uso e performance em complexidade extrema.
  • O Anti-Gravity caiu para o nível A, perdendo competitividade frente ao uso direto de modelos nativos.
  • OpenClaw e Hermes são classificados como nível C/D por representarem teatro de produtividade com alto custo e pouca entrega prática.

Agentes de codificação foram avaliados pela sua eficácia real em projetos de desenvolvimento. O Claude Code e o CodeX dominam o espaço, enquanto ferramentas como OpenClaw são criticadas por criar uma ilusão de trabalho (dashboards e automações visuais) sem superar a eficiência dos agentes de codificação diretos.

Construtores No-Code e Ferramentas Especializadas

  • Lovable e Bolt são classificados como nível D por não justificarem o custo perante a eficácia dos novos agentes de codificação.
  • O N8N tornou-se uma ferramenta de nicho para clientes não técnicos, embora ferramentas como Make e Zapier sejam consideradas nível D.
  • O NotebookLM é nível S por ser a melhor ferramenta de pesquisa gratuita disponível, permitindo a análise de múltiplos vídeos.
  • O Perplexity caiu para o nível C por ser um custo adicional pouco justificado para a maioria dos usuários que já utilizam outros chatbots.

A categoria de no-code sofreu uma queda drástica de valor conforme os agentes de codificação ficaram mais acessíveis e capazes. Ferramentas como o Lovable, que antes entregavam valor, hoje cobram um prêmio pela conveniência que não supera a capacidade técnica dos novos agentes. O NotebookLM destaca-se como a exceção de alto valor, sendo indispensável para pesquisa.

Criação de Conteúdo e Modelos de Imagem/Vídeo

  • O Design by Claude é nível B, equilibrando um desempenho visual excelente com um consumo de tokens insustentável.
  • O Seedance 2.0 supera concorrentes como Cling e Veo em qualidade visual e custo-benefício.
  • Nano Banana Pro e o novo Image Gen 2 do GPT são classificados como nível S e A, respectivamente, para geração de imagens.

Ferramentas de criação foram avaliadas pelo equilíbrio entre qualidade de saída e custo de uso. O Design by Claude exemplifica o problema do alto consumo de tokens em ferramentas de interface, enquanto o Seedance 2.0 lidera o espaço de vídeo pela sua qualidade superior e custo acessível.

Community Posts

View all posts