Eu tentei gerir uma empresa feita de Agentes de IA

BBetter Stack
Computing/SoftwareSmall Business/StartupsManagementInternet Technology

Transcript

00:00:00Eu dei o mesmo repo para três agentes de IA e, juntos, eles formaram uma empresa. Um tentou criar a
00:00:06funcionalidade, outro reescreveu a arquitetura e outro abriu e lidou com todos os tickets. Sem
00:00:12estrutura, toda configuração multiagente se torna confusa e encarece a conta rapidamente.
00:00:17Este é o Paperclip, e ele tenta resolver isso. Um comando te dá um plano de controle local para
00:00:22agentes de IA com organogramas, tickets, orçamentos, logs de auditoria e até pulsações (heartbeats).
00:00:27Ele acabou de passar de 64.000 estrelas no GitHub.
00:00:30Vamos montar nossa própria empresa com alguns agentes de IA em poucos minutos.
00:00:33Agora, o detalhe sobre agentes é o seguinte. Um único agente parece legal. Você dá uma tarefa, ele escreve
00:00:44o código. Ótimo trabalho. Aí você coloca um segundo, ou até um terceiro agente. O que acontece é que,
00:00:51de repente, isso vira apenas trabalho de gestão. Quem é o dono da tarefa? Essa é a questão. Quem
00:00:57lembra do objetivo final e quem para o agente quando ele começa a fazer a coisa errada?
00:01:03Esse é o problema que o Paperclip quer resolver. Agentes puros trabalhando sozinhos não são ideais. Úteis,
00:01:08mas difíceis de coordenar. O Paperclip os transforma em um time, ou, neste caso, em uma
00:01:13empresa. Definimos um objetivo, criamos um organograma. Talvez haja um CEO, um CTO,
00:01:20dois engenheiros e um agente de pesquisa. O Paperclip coordena tudo via tickets, heartbeats,
00:01:27orçamentos, aprovações e rastreabilidade. Vemos a tarefa, quem a atribuiu, quanto custou
00:01:33de verdade e se ainda está conectada ao objetivo final. Orquestração com menos achismos?
00:01:39Vamos ver isso ao vivo. Se você gosta de ferramentas de código para agilizar seu fluxo, não se esqueça
00:01:43de se inscrever. Temos vídeos novos o tempo todo. Certo, agora vejam isso. Em um terminal limpo,
00:01:49vou rodar NPX Paperclip AI onboard. Isso inicia a configuração local. Poucos momentos
00:01:56depois, o Paperclip está rodando com o dashboard. Tenho serviços locais, o Postgres vem junto,
00:02:03e autenticação. Aqui está toda a interface onde posso criar uma nova empresa. Vou
00:02:09criar uma nova empresa chamada “dev tools company”, ou o que quer que você queira criar. Para isso,
00:02:14vou definir esta meta. O objetivo é simples: quero criar e lançar um MVP de encurtador de URL esta
00:02:20semana. Agora posso adicionar um agente CTO e dois engenheiros via adaptadores. Um desses agentes
00:02:28engenheiros cuida do backend. O outro cuida do frontend e da cobertura de testes. Antes de dar
00:02:34start, vou definir o orçamento. Esta parte é a que realmente importa, pois o objetivo é não deixar
00:02:39os agentes fritarem minha API até a conta explodir. O foco é autonomia controlada. Também preciso definir
00:02:46o caminho para o diretório de trabalho onde o código será gerado. Vou definir isso aqui.
00:02:50Agora posso ativar os heartbeats e começar. Vamos observar o painel. Os agentes acordam
00:02:57no heartbeat. O CTO quebra o objetivo em tickets. Nossos engenheiros já estão pegando o trabalho.
00:03:05Vejam a delegação, tickets, histórico, mudanças de status e o contador de orçamento, tudo
00:03:10interligado. E agora a primeira tarefa de implementação já está avançando para um commit de código.
00:03:15Isso levou um bom tempo para rodar, mas faz sentido tendo todos esses agentes juntos,
00:03:19mesmo assim não é o mais rápido, especialmente se você estiver tentando escalar ainda mais.
00:03:24Não é mais apenas um agente em uma caixa de chat. Agora é uma pequena empresa rodando
00:03:30através desses agentes: CEO, CTO e todos os engenheiros. É aqui que as pessoas se
00:03:37confundem. À primeira vista, o Paperclip parece outro framework de agentes, como CrewAI, AutoGen
00:03:43ou um fluxo estilo LangGraph. Mas o ponto não é esse. Essas ferramentas são ótimas quando
00:03:49você quer um fluxo, tipo: pesquisador, planejador, escritor e revisor. Útil, claro. Mas o Paperclip foca
00:03:55em um nível acima. Não são apenas os trabalhadores; é a empresa que envolve esses
00:04:01trabalhadores nesse organograma para ajudar a construir as coisas. Pense da seguinte forma:
00:04:07Um único agente é só um funcionário. Um fluxo é como o seu checklist. O Paperclip é o gerente,
00:04:13o organograma, o quadro de tickets, o sistema de orçamento e o log de auditoria. O Paperclip é
00:04:20o gestor. Sobre as perguntas que você já está se fazendo: um agente consegue escrever código?
00:04:25Já sabemos que sim. Esse é o propósito, ele já está gerando. As perguntas difíceis são:
00:04:30Ele consegue trabalhar na tarefa certa? Ele consegue parar quando deveria? Consegue passar o trabalho de forma clara?
00:04:36Consigo inspecionar o que está acontecendo aqui? E a resposta curta para tudo isso é: sim.
00:04:43O Paperclip oferece estado, heartbeats, orçamento, hierarquia e logs. Oferece até templates
00:04:49portáteis e um dashboard que parece mais um Jira ou Linear para agentes do que outra janela de chat.
00:04:55Você para de dar prompts para um agente e começa a controlar essa mini organização. Muitos de nós
00:05:02ainda alternamos entre terminais e setups. Um terminal para Claude Code, uma aba para o Cursor,
00:05:07um agente para pesquisa, um script para issues do GitHub, certo? Alternamos entre várias janelas,
00:05:13mas o Paperclip dá a tudo isso um modelo operacional compartilhado. O modelo mental de tudo isso
00:05:18muda para nós. Em vez de dizer “Ei, por favor, crie esta funcionalidade”, o que
00:05:24estamos dizendo agora é algo como: “O objetivo desta empresa é lançar este
00:05:30produto. Aqui estão as regras da empresa. Aqui está o organograma e aqui está o orçamento.”
00:05:35“Aqui está o que precisa de aprovação. Agora, rode.” Sendo honesto, a estrutura é ótima,
00:05:41certo? Tickets, histórico, delegação, tudo isso. O trabalho multiagente fica mais fácil de entender
00:05:46com isso. Em vez de só dizer que o agente fez algo, bravo. Você vê quem atribuiu
00:05:52o trabalho, por que ele existe e onde ele se encaixa no código. Definir orçamentos também é vital.
00:05:58Muitas ferramentas tratam custos como algo que você checa depois. O Paperclip torna o custo
00:06:05parte do ciclo de controle. Definimos o orçamento antes da execução. É auto-hospedado e open
00:06:12source. Outra grande vitória. Você pode rodar localmente, inspecionar, modificar e conectar
00:06:17aos agentes que já usa. Mas, ao mesmo tempo que tudo isso é bom, a mesma estrutura
00:06:22que torna o Paperclip poderoso também pode ser bem irritante. Se as regras forem ruins, os agentes podem
00:06:27criar tickets sobre bobagens. Eu queria um encurtador simples, mas talvez meu agente CTO tenha aberto
00:06:32todo um outro plano que eu nem queria. Então, não, obrigado. O gasto de tokens também é real,
00:06:39certo? É por isso que temos orçamentos para controlar, mas isso não corrige prompts ruins ou regras
00:06:45vagas. E pessoal, se os seus arquivos skill.md forem ruins, sua empresa agirá como uma startup confusa,
00:06:52entenderam? Então o skill.md é o que precisa estar forte aqui. E por fim, honestamente,
00:06:59se você estiver fazendo um script simples, isso é um exagero total. Eu só queria testar,
00:07:03não precisava disso para este projeto. Se você quer só um agente para resumir um arquivo ou corrigir um bug,
00:07:08você não precisa disso. Isso aqui é para construir muito mais, com vários agentes trabalhando
00:07:13em conjunto. Com certeza vale a pena usar, mas não serve para tudo. Se você gosta de ferramentas e
00:07:18dicas de código assim, não deixe de se inscrever. Nos vemos no próximo vídeo.
00:07:23dicas como essa, não deixe de se inscrever. Nos vemos no próximo vídeo.

Key Takeaway

O Paperclip transforma agentes de IA isolados em uma estrutura organizacional funcional com hierarquia e controle financeiro, permitindo a gestão de projetos complexos como o lançamento de um MVP em uma semana através de tickets e monitoramento de custos.

Highlights

  • O Paperclip atingiu a marca de 64.000 estrelas no GitHub como uma ferramenta de orquestração local para agentes de IA.

  • A configuração do ambiente ocorre em poucos minutos através do comando npx paperclip-ai onboard, que instala localmente banco de dados Postgres e sistema de autenticação.

  • O sistema utiliza um mecanismo de heartbeats para ativar agentes e processar a quebra de objetivos complexos em tickets de trabalho.

  • Diferente de frameworks de fluxo como LangGraph ou CrewAI, esta ferramenta foca na camada de gestão com organogramas, orçamentos e logs de auditoria.

  • A definição de orçamentos prévios impede que falhas em loops de agentes ou prompts vagos resultem em cobranças excessivas de APIs.

  • A qualidade da execução depende diretamente da precisão dos arquivos skill.md, que definem as competências e regras de operação da organização virtual.

Timeline

O problema da gestão multiagente

  • Configurações multiagente sem estrutura geram confusão operacional e custos elevados rapidamente.
  • A falta de um dono de tarefa dificulta a manutenção do foco no objetivo final quando os agentes começam a agir de forma errada.
  • O Paperclip estabelece um plano de controle local com organogramas, tickets e logs de auditoria.

Agentes trabalhando de forma isolada têm dificuldade em coordenar tarefas interdependentes, como reescrever arquitetura e lidar com tickets simultaneamente. A ferramenta resolve essa lacuna ao transformar o fluxo de trabalho em uma empresa com funções definidas como CEO, CTO e engenheiros. O acompanhamento é feito via dashboard, permitindo visualizar quem atribuiu cada tarefa e o custo real de cada ação.

Configuração técnica e operacional

  • O comando npx paperclip-ai onboard inicia automaticamente serviços de banco de dados e interface local.
  • Definir orçamentos antes da execução é o mecanismo principal para evitar o consumo descontrolado de tokens de API.
  • O CTO automatiza a divisão do objetivo principal em tickets menores para os agentes engenheiros.

O processo de criação de uma empresa, como uma startup de encurtador de URL, exige a definição de metas e o mapeamento de diretórios de trabalho. Os agentes acordam através de sinais de heartbeat e iniciam a delegação de tarefas, progredindo até o commit de código. O painel centraliza o histórico de mudanças de status e o contador de orçamento em tempo real.

Diferenciação entre frameworks e gestão

  • O foco do sistema está na camada de gestão organizacional e não apenas no fluxo de trabalho sequencial.
  • A interface substitui janelas de chat tradicionais por um modelo operacional similar a ferramentas como Jira ou Linear.
  • A estrutura permite inspecionar se o trabalho está sendo passado de forma clara entre os agentes.

Enquanto ferramentas como CrewAI ou AutoGen são ideais para fluxos de pesquisa e escrita, esta solução atua como o gerente que envolve esses trabalhadores. O modelo mental muda de dar prompts isolados para controlar uma mini organização com regras de aprovação e hierarquia. Isso resolve dúvidas sobre a capacidade do agente de parar uma tarefa ou priorizar o que é correto.

Limitações e boas práticas

  • Regras mal definidas ou arquivos skill.md fracos resultam em agentes criando tickets irrelevantes ou desnecessários.
  • O uso da estrutura completa é considerado excessivo para scripts simples ou correções de bugs isolados.
  • O sistema é open source e permite execução totalmente local para inspeção e modificação de comportamento.

A robustez da estrutura pode se tornar um obstáculo se a startup virtual for configurada com instruções vagas, levando ao desperdício de tokens. O sucesso da automação depende da força das definições de competências no arquivo MD. A ferramenta é recomendada especificamente para projetos de maior escala que exigem a colaboração de múltiplos agentes em sincronia.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video