O agente de codificação "PI" é muito mais do que apenas outro agente incrível!

MMaximilian Schwarzmüller
Computing/SoftwareSmall Business/StartupsStocksInternet Technology

Transcript

00:00:00Tenho que falar de mais um agente de codificação. E eu sei, eu sei, já fiz vídeos
00:00:07e cursos sobre o Claude Code e o Codex porque ambos são incríveis e você também tem, claro,
00:00:15o Cursor e o GitHub Copilot, e também tenho um curso sobre eles, os links estão abaixo. Mas hoje
00:00:21quero falar sobre o agente de codificação Pi, até porque ele é muito mais do que apenas um agente de código.
00:00:31Novamente, todas essas ferramentas funcionam. Não existe escolha certa ou errada. E eu entendo perfeitamente
00:00:38que tudo isso pode parecer as guerras de frameworks, as guerras de frameworks JavaScript de 2019 de novo,
00:00:46onde toda semana surgia uma ferramenta nova e brilhante. E sim, até certo ponto, é meio que assim,
00:00:53eu acho. Mas, por outro lado, assim como naquela época, sendo bem sincero, não importa
00:01:00tanto qual você escolhe. Este também não é um vídeo patrocinado e eu não tenho um curso sobre isso.
00:01:06Eu genuinamente acho que este agente Pi é uma ferramenta que você também deveria conhecer. Agora,
00:01:13ao contrário do Codex e do Claude Code ou Open Code, por exemplo, este não exige uma assinatura
00:01:20específica. Com o Open Code, claro, você também pode usar sem assinatura usando outra
00:01:27assinatura, como a do Codex, ou pagando pelo uso. Com o agente de codificação Pi,
00:01:32você só tem a opção de pagar por uso ou de usar outra assinatura. Por exemplo,
00:01:39aqui, eu o instalei no meu sistema e estou usando com minha assinatura do Codex, que eu
00:01:45poderia usar com o app ou CLI do Codex, mas que também posso usar aqui. Acho que você também
00:01:50pode usar com a assinatura do Anthropic Claude Code, mas talvez você tenha ouvido falar
00:01:55que eles não gostam disso e que sua conta pode ser banida, pelo que eu saiba. Mas o que há de tão especial
00:02:00neste Pi? Por que você o usaria em vez da CLI regular do Codex? Por vários motivos. Primeiro,
00:02:08o Pi, este agente, é super enxuto e simples no bom sentido. Ele tem um prompt de sistema bem minimalista
00:02:20e vem com apenas algumas ferramentas. Essencialmente, pelo que eu sei, se isso não mudou,
00:02:28ele só vem com leitura, escrita, edição e uma ferramenta bash. E a ferramenta bash, claro, é a mais poderosa,
00:02:36porque se você tem uma ferramenta bash, você essencialmente tem acesso a tudo, pois pode,
00:02:44obviamente, controlar todo o seu sistema, sua máquina inteira apenas com o bash, com a linha de comando,
00:02:50no final das contas, já que pode invocar várias outras ferramentas por ali. E acontece que,
00:02:55como também abordei em outro vídeo, as CLIs parecem ser, pelo menos agora, a principal coisa que você quer
00:03:03expor aos seus agentes, aos seus agentes de codificação, porque eles são muito bons em usar CLIs, mesmo
00:03:10aquelas que nunca viram antes. E, claro, através de CLIs, interfaces de linha de comando,
00:03:15ou ferramentas escritas por outras pessoas, seus agentes podem fazer um monte de coisas no seu computador. Eles podem enviar
00:03:21requisições HTTP. Podem criar e executar scripts. Podem analisar dados JSON. Podem fazer
00:03:29todo tipo de coisa. E essa é a filosofia deste agente Pi. Bem minimalista, mas com acesso
00:03:35à ferramenta mais poderosa, o bash, para que possa fazer essencialmente tudo. E combinado com
00:03:41um prompt de sistema bem enxuto e minimalista integrado, você tem um agente com uma janela de contexto
00:03:50que não fica sobrecarregada e que é muito flexível para fazer o que você quiser, por assim dizer. E
00:03:57a filosofia deles realmente é que, em vez de colocar muita coisa lá dentro, você recebe um agente
00:04:04que é super extensível. Você pode instalar algo chamado extensões. Voltaremos a isso.
00:04:10Você pode usar habilidades de agente. Aqui estou falando deste padrão oficial, que é tipo um padrão,
00:04:17eu acho, que certas ferramentas implementam de forma diferente. Mas a ideia central por trás das habilidades de agente é
00:04:24que você tem diretórios de habilidades e arquivos MD de habilidades, com prompts ou contexto extra lá dentro,
00:04:31como preferir chamar. E eles são carregados sob demanda, não antecipadamente, mas de forma ociosa,
00:04:39dependendo da tarefa em que seu agente está trabalhando. Por exemplo, nesta sessão do Pi que está rodando aqui,
00:04:46tenho várias habilidades carregadas, algumas globais que configurei para testar
00:04:53e outras que são muito úteis, como uma habilidade de pesquisa de código, por exemplo. E se eu
00:04:59der uma olhada nela, verá que é apenas um arquivo markdown com um nome e uma descrição. A descrição é,
00:05:03claro, super importante nessas habilidades porque é o que faz o agente realmente
00:05:08ativar e usar uma habilidade. Ele só carrega o resto do arquivo se decidir que a
00:05:16habilidade é relevante para a tarefa dada com base no nome e na descrição aqui. E então, bem, novamente,
00:05:21isso é apenas contexto extra, apenas um prompt extra onde, no caso da minha habilidade de pesquisa de código,
00:05:26eu digo a qualquer agente interessado, como o Pi, mas também o Codex, se ele carregar essa habilidade,
00:05:32como fazer pesquisa de código, como eu quero que faça, que ele deve usar a ferramenta MC Porter
00:05:38do Peter Steinberger para usar outros servidores MCP, como o servidor MCP deep wiki, que é um servidor MCP
00:05:46que pode ser usado para explorar repositórios GitHub e aprender mais sobre eles, e algumas outras ferramentas
00:05:51que ele deve usar para pesquisar. E essa é outra coisa importante aqui: falando de MCPs, o agente Pi
00:05:58não tem suporte para MCP. O motivo é que os MCPs tendem a encher muito a sua janela
00:06:05de contexto, porque há muita informação sobre as ferramentas e recursos MCP disponíveis
00:06:10que precisam ser colocadas no contexto para a IA ter consciência deles. E a equipe ou a pessoa
00:06:18por trás do Pi não quer isso. Essa é a lógica. É uma opinião compartilhada por muitas outras pessoas,
00:06:23inclusive eu. E eu sei que existem soluções como a busca MCP para isso, mas ainda assim
00:06:28não há suporte para MCP aqui. E você nem precisa dele se usar algo como esta ferramenta MC Porter. E
00:06:35quando digo usar, quero dizer que estou ensinando a IA a invocar este MC Porter na hora quando ela
00:06:43quiser trabalhar com MCP, de modo que isso não precise ser instalado ou exposto
00:06:49à janela de contexto. Deu para entender? É realmente minimalista e enxuto. E essa é toda a
00:06:54história ou o ponto principal deste agente de codificação Pi. Já mencionei isso. Outra coisa excelente sobre
00:07:01este agente, porém, é sua extensibilidade. E não se trata apenas de habilidades. É, antes de tudo, eu acho,
00:07:08sobre extensões. E a ideia por trás das extensões é que este agente Pi tem suporte nativo
00:07:16para ser estendido, permitindo intervir em diferentes partes do agente, em diferentes etapas do
00:07:22loop de agenciamento. Assim, enquanto o agente trabalha, ele permite que você faça todo tipo de coisa e o estenda
00:07:30de todas as formas. Você poderia, por exemplo, adicionar suporte a MCP se quisesse.
00:07:36Agora, eu mesmo configurei algumas extensões aqui. Por exemplo, adicionei um modo de planejamento através
00:07:41de uma extensão. Você pode fazer isso. Não há um modo de plano integrado por padrão, mas ele é tão extensível
00:07:47que você pode adicionar um que impeça o agente de usar ferramentas de escrita ou edição. Se ele ainda estiver
00:07:53no modo de plano, esta extensão permite configurar um atalho para alternar para esse modo
00:08:00de planejamento. Ela permite atualizar a interface, a UI do terminal, para mostrar ao usuário que está no modo de plano.
00:08:07Você também pode adicionar comandos extras com barra, como /plan, que me coloca no modo de plano, e me dá este
00:08:14indicador aqui. E agora, por exemplo, certas ferramentas seriam bloqueadas e eu posso sair do modo novamente.
00:08:20Então, esse é o tipo de coisa que você pode fazer com extensões. E também existe
00:08:24um tipo de marketplace oficial de extensões, porque este agente Pi também tem a ideia de permitir que você
00:08:31empacote suas extensões ou habilidades e as compartilhe com outros. E outras pessoas como você e eu
00:08:36podemos instalar esses pacotes para, por exemplo, instalar extensões criadas por outras pessoas.
00:08:40E existem coisas como subagentes, que você pode adicionar via pacote que inclui uma extensão
00:08:47para adicionar os subagentes, ou o pacote de acesso à web, que é ótimo e dá ao agente ferramentas extras
00:08:54para fazer pesquisa na web e buscar conteúdo de sites de forma eficiente. Então, deu para entender. É realmente
00:09:00extensível. Você tem um núcleo bem minimalista e pode estendê-lo como quiser, adicionar as
00:09:06habilidades e extensões que desejar. E isso por si só já é muito interessante porque, é
00:09:12claro, com o Claude Code e com o Codex e todas essas outras ferramentas, você recebe ferramentas pré-prontas que
00:09:20são muito mais poderosas de fábrica, mas também menos extensíveis. Com o Pi, a ideia é oposta.
00:09:28Você recebe um núcleo mínimo e pode transformá-lo no que quiser. E você pode fazer isso
00:09:33globalmente, mas também por projeto, porque todas essas habilidades e extensões podem ser
00:09:39instaladas globalmente ou por projeto. E isso o torna muito versátil. É por isso que vale a pena
00:09:46dar uma olhada. Tenho usado ele nas últimas semanas. Além do Claude Code e do Codex, fico alternando
00:09:51o tempo todo porque essas ferramentas evoluem rápido e eu gosto muito do Pi. Agora, aqui está o
00:09:59interessante. Você não está limitado a usar o Pi apenas para codificação. Ele é chamado de agente
00:10:08de codificação e é para isso que você provavelmente o usará primeiro, e é para o que eu o
00:10:15tenho usado. Mas você não está restrito a isso. Por exemplo, eu instalei o pacote de acesso
00:10:21à web aqui e o conectei à minha chave de API do Gemini para dar a este agente Pi acesso total à pesquisa
00:10:30na web baseada na API do Gemini. E, portanto, eu poderia rodar este agente fora de qualquer projeto,
00:10:35fora de qualquer projeto de código, e dar ao meu agente uma tarefa como esta: Faça uma pesquisa sobre os
00:10:41últimos sete dias das ações da Apple e da Nvidia, busque seus preços e faça uma análise do
00:10:46desempenho delas nesses sete dias. E se eu fizer isso, ele vai lá e faz. Ele vai descobrir uma forma de
00:10:55buscar os dados de preços dessas ações. Vai fazer uma busca na web, talvez visitar as páginas de relações
00:11:04com investidores, veremos. E então ele também fará, claro, os cálculos reais, criando um
00:11:12script temporário ou algo do tipo. Veremos o que ele faz. Por exemplo, aqui ele ativou uma habilidade
00:11:18de pesquisa web que adicionei, onde dou mais detalhes sobre como ele deve pesquisar na web. E então ele tenta
00:11:23fazer isso. Agora, estou com um problema aqui porque não tenho o Python instalado ou não com esse nome de
00:11:29executável, deveria ser python3, e ele percebeu isso também. E então escreveu
00:11:34o script onde buscou alguns dados de um site com a ajuda do Python, um script temporário,
00:11:40que ele executou aqui, e parece que conseguiu alguns preços de ações. E então ele provavelmente
00:11:47também vai escrever um pequeno script que permite fazer os cálculos com base nisso e calcular a
00:11:55variação no preço das ações. E após um tempo trabalhando e pesquisando várias
00:12:01coisas, incluindo algumas notícias, ele terminou. E ele me dá os últimos sete dias para Apple
00:12:08e Nvidia, mostrando como as ações se desenvolveram nesses dias. Me dá alguns resumos de desempenho
00:12:14aqui. E ele me dá uma análise textual onde resume os resultados para eu
00:12:23ler como um relatório executivo. E tudo isso foi feito por este agente de codificação Pi com as
00:12:29extensões e habilidades que eu dei a ele, mas nada mais. Sem código da minha parte, sem instruções específicas
00:12:36de quais sites visitar. Ele fez tudo sozinho. E você poderia fazer isso com o Claude Code
00:12:43ou o Codex também, porque no fim das contas, são todos agentes de IA com várias ferramentas para realizar tarefas.
00:12:50E embora sejam focados em código, você pode, claro, “abusar” deles para fazer todo
00:12:56tipo de outra coisa. Porque, no final das contas, essa tarefa também envolveu acessar alguns
00:13:01sites e escrever alguns scripts, o que é muito similar a projetos de código onde você também quer
00:13:06que ele busque documentações e escreva código, certo? Então ele pode fazer várias outras coisas.
00:13:11A razão pela qual o Pi, na minha opinião, é um pouco melhor para tarefas assim do que o Codex ou
00:13:17o Claude é que ele tem esse núcleo minimalista e pode ser estendido para ser exatamente a ferramenta que você quer,
00:13:24mesmo projeto por projeto se desejar. Então você pode ter um projeto no seu sistema que tem um
00:13:29especialista em pesquisa, outro projeto com um especialista em pesquisa de ações, e um terceiro projeto
00:13:37com um especialista totalmente diferente, um para analisar seu sistema e a utilização do seu disco rígido,
00:13:42ou qualquer coisa do tipo. E essa é provavelmente a razão pela qual o OpenClaw
00:13:50está usando o Pi internamente. Aqui estou no deep wiki para o repositório OpenClaw. Caso você não
00:13:55conheça, é um ótimo site para aprender mais sobre repositórios GitHub. Ele os analisa e então
00:14:00gera uma documentação na hora baseada no código que vê lá. E você também pode
00:14:05conversar com o repositório, por assim dizer. E aqui eu poderia perguntar: o OpenClaw usa o agente Pi
00:14:12internamente? Se sim, como? E ele vai analisar esse código, que já está carregado. E ele me diz,
00:14:18sim, o OpenClaw está usando o agente de codificação Pi. E então me explica exatamente como isso é implementado. Então
00:14:24é isso, esse é o agente Pi. E eu achei que valia a pena compartilhar. De novo, não é porque eu ganho
00:14:31algo com isso. Não tenho curso, não tenho nada. Mas é uma ótima ferramenta, especialmente
00:14:38se você está planejando ou quer brincar com agentes para tarefas que não são de codificação. Mas é claro,
00:14:44para ser bem claro sobre isso também, ele serve para tarefas de código, pode fazer ambos. É um
00:14:50agente de IA muito versátil. Você pode até construir suas próprias ferramentas sobre ele, como vê com o OpenClaw.
00:14:56E você pode fazer todas essas coisas com o Codex também. Mas, de novo, o núcleo minimalista é incrível aqui.
00:15:02Então, além do Codex ou do Claude Code, ou em vez deles, este aqui pode valer a pena. E sim,
00:15:09é algo com o qual me diverti muito nas últimas semanas. E estou animado para ver
00:15:14para onde toda essa coisa de agentes está indo e o que poderemos fazer com eles daqui a um ano. É
00:15:18tudo um pouco assustador, devo dizer, mas também muito, muito interessante. Uma mistura estranha.

Key Takeaway

O agente de codificação Pi redefine a automação ao oferecer um núcleo minimalista e extensível que prioriza a eficiência do contexto e a versatilidade para tarefas além da programação.

Highlights

O agente Pi destaca-se por sua filosofia minimalista, focando em um núcleo enxuto para evitar a sobrecarga da janela de contexto.

A ferramenta utiliza o Bash como sua principal funcionalidade, permitindo o controle total do sistema e a execução de tarefas complexas via linha de comando.

Diferente de outros agentes, o Pi é altamente extensível através de "habilidades" (skills) e "extensões", que podem ser carregadas sob demanda.

O suporte a MCP (Model Context Protocol) foi deliberadamente omitido para manter a eficiência do contexto, mas pode ser simulado via ferramentas externas.

O Pi é versátil o suficiente para realizar tarefas que não são de codificação, como pesquisa de mercado e análise de dados financeiros em tempo real.

A estrutura do Pi permite personalização tanto global quanto por projeto, oferecendo flexibilidade superior ao Claude Code ou Codex em certos cenários.

Timeline

Introdução e Comparação com Outros Agentes

O palestrante introduz o agente Pi no contexto de ferramentas populares como Claude Code, Codex, Cursor e GitHub Copilot. Ele explica que, embora existam muitas opções que lembram as "guerras de frameworks" do passado, a escolha da ferramenta deve se basear na utilidade e não apenas em tendências. O vídeo não é patrocinado, refletindo uma opinião genuína sobre a eficácia do Pi no fluxo de trabalho de desenvolvimento. Um ponto importante mencionado é que o Pi não exige uma assinatura exclusiva, permitindo o uso com modelos já existentes. Esta seção estabelece a base para entender por que o Pi merece atenção em um mercado saturado.

Arquitetura Minimalista e o Poder do Bash

Nesta parte, são exploradas as razões técnicas para o uso do Pi, destacando seu prompt de sistema minimalista. O agente foca em ferramentas básicas de leitura, escrita e edição, mas tem no comando Bash seu recurso mais poderoso. Através do Bash, o agente pode invocar qualquer funcionalidade do sistema operacional, desde requisições HTTP até análise de arquivos JSON complexos. O palestrante argumenta que as interfaces de linha de comando (CLIs) são a melhor forma de expor capacidades aos agentes de IA. Essa abordagem mantém a janela de contexto limpa, garantindo que a IA permaneça focada e eficiente em suas respostas.

Extensibilidade: Habilidades e Extensões

A filosofia central do Pi é a extensibilidade, permitindo que o usuário adicione "habilidades" conforme a necessidade. Essas habilidades são definidas em arquivos Markdown que o agente carrega apenas quando identifica que são relevantes para a tarefa atual. O palestrante demonstra como usa uma habilidade de pesquisa de código que ensina o agente a interagir com servidores MCP sem sobrecarregar o contexto nativo. É explicada a decisão consciente de não oferecer suporte nativo a MCP para evitar o preenchimento desnecessário da janela de contexto com descrições de ferramentas. Esse sistema de carregamento ocioso garante que o agente tenha acesso a informações especializadas apenas quando estritamente necessário.

Customização Avançada e Marketplace de Extensões

O vídeo detalha como as extensões permitem intervir em diferentes etapas do loop de agenciamento para modificar o comportamento do Pi. O palestrante exemplifica isso mostrando um "modo de planejamento" personalizado que bloqueia ferramentas de escrita até que um plano seja aprovado. Existe também a menção a um marketplace oficial onde usuários podem compartilhar pacotes que incluem subagentes ou acesso à web. A versatilidade de instalar essas extensões de forma global ou específica por projeto é destacada como um grande diferencial competitivo. Ao contrário do Claude Code, que vem com ferramentas pré-configuradas e rígidas, o Pi oferece um chassi básico que o usuário molda como preferir.

Casos de Uso Além do Código e Demonstração Prática

O palestrante demonstra que o Pi é muito mais do que um assistente de programação, utilizando-o para uma tarefa de análise financeira. Ele solicita ao agente uma pesquisa sobre o desempenho das ações da Apple e Nvidia nos últimos sete dias, incluindo busca de preços e análise comparativa. O agente executa a tarefa autonomamente, criando scripts Python temporários para coletar e processar os dados da web. O resultado final é um relatório executivo detalhado com cálculos de variação percentual e resumos textuais gerados sem intervenção manual. Essa demonstração prova que a lógica de agentes de codificação pode ser aplicada com sucesso a qualquer automação de fluxo de trabalho complexo.

Conclusão: O Futuro dos Agentes e OpenClaw

Para encerrar, o palestrante revela que o projeto OpenClaw utiliza o agente Pi internamente, comprovando sua robustez e confiabilidade. Ele utiliza a ferramenta Deep Wiki para analisar o repositório do OpenClaw e confirmar como o Pi é implementado no código-fonte. O vídeo conclui reforçando que o Pi é uma ferramenta excelente para quem deseja experimentar com agentes em diversas tarefas, não se limitando apenas ao desenvolvimento. O palestrante expressa uma mistura de entusiasmo e apreensão sobre a velocidade com que a tecnologia de agentes está evoluindo. Ele encoraja os espectadores a testarem o Pi como uma alternativa versátil e minimalista às soluções mais tradicionais do mercado.

Community Posts

View all posts