O Kimi K2.6 consegue abrir um negócio em 40 minutos! (Análise completa do modelo)

Portuguêsالعربية Deutsch English Español Français हिन्दी Bahasa Indonesia 日本語 한국어 Русский 中文

Computing/SoftwareAdvertising/MarketingSmall Business/StartupsInternet Technology

Transcript

00:00:00Como podem ver por este exemplo, basicamente podem lançar a vossa própria pequena agência web

00:00:04em 40 minutos usando esta funcionalidade do Kimi.

00:00:07Bem pessoal, a Moonshot AI está de volta com outra atualização do seu principal modelo, o Kimi.

00:00:13O Kimi K 2.6 é o seu modelo mais recente, que promete codificação de última geração,

00:00:18execução de longo horizonte e capacidades de enxame de agentes.

00:00:22No vídeo de hoje, vamos analisar este novo modelo, ver como ele se comporta em diferentes

00:00:27tarefas agentivas e descobrir se é realmente tão impressionante quanto anunciado.

00:00:32Vai ser muito divertido, então vamos mergulhar nisso.

00:00:34Há alguns meses, analisei o Kimi K 2.5 e ele teve um desempenho muito bom no design front-end.

00:00:44E fiquei genuinamente impressionado com a funcionalidade de enxame de agentes deles.

00:00:48Também adorei o facto de terem investido tanto esforço na experiência do utilizador na sua página de chat.

00:00:54Portanto, nesta próxima iteração, o Kimi promete alguns saltos bastante grandes

00:00:57na forma como realmente usamos agentes de IA num ambiente de produção.

00:01:02Primeiro, o enxame de agentes basicamente triplicou.

00:01:05No K 2.5, estávamos a ver cerca de 100 subagentes, mas o K 2.6 escala isto horizontalmente

00:01:12para 300 agentes especializados que podem executar até 4.000 passos coordenados.

00:01:18Portanto, esta é uma atualização bastante massiva.

00:01:20Então, agora podem executar mais tarefas em paralelo ao mesmo tempo.

00:01:24Adicionaram também um novo modo de pensamento preservado,

00:01:26que mantém o rasto de raciocínio do modelo consistente em tarefas de vários turnos.

00:01:31Isso evita a deriva de memória que geralmente acontece quando se está no meio de um fluxo de trabalho complexo.

00:01:36E depois temos as tarefas de longo horizonte.

00:01:39E nos seus próprios testes, ele geriu uma tarefa de engenharia de 13 horas com um ganho de rendimento de 185%.

00:01:46E quando se trata de estética, passou para o design orientado por código.

00:01:51Em vez de apenas criar uma página de destino bonita, o K 2.6 usa o seu próprio codificador de visão nativo

00:01:57chamado MoonVIT para raciocinar sobre estruturas de UI e UX a um nível mais profundo.

00:02:03Agora pode lidar com fluxos de trabalho full stack, desde autenticação até registo em base de dados,

00:02:08transformando uma única referência visual ou um prompt num protótipo interativo totalmente funcional

00:02:14com animações GSAP e efeitos de scroll, e todo o tipo de outras coisas boas.

00:02:19E, aliás, tudo isto é open source, incluindo o codificador de visão.

00:02:23Portanto, se quisessem, poderiam realmente executá-lo de forma independente,

00:02:26desconectado da arquitetura do Kimi se obtiverem o modelo a partir do Hugging Face.

00:02:30Portanto, tudo isto parece muito impressionante, mas vamos testá-lo e ver como funciona realmente.

00:02:35E os modelos do Kimi são open source, por isso poderiam teoricamente usá-lo em qualquer configuração que preferirem.

00:02:40Mas para testar o seu Enxame de Agentes, vou usar a sua própria interface de chat

00:02:46para obter os melhores resultados. Antes de mais, quero experimentar a nova funcionalidade de Enxame de Agentes.

00:02:50Olhando para os exemplos deles no site, uma coisa chamou-me realmente a atenção.

00:02:54Foi esta secção onde o K 2.6 foi usado para identificar 30 lojas de retalho em Los Angeles sem

00:03:01sites oficiais a partir do Google Maps e gerar páginas de destino de alta conversão para cada uma delas.

00:03:06Tenho visto esta tendência a circular no Instagram, por isso quero experimentá-la e ver se conseguimos realmente

00:03:11criar a nossa própria pequena agência web. Então, para este teste, decidi fazer algo semelhante.

00:03:16Eu vivo em Toronto e o que tenho notado é que muitos notários na minha área têm sites

00:03:21inexistentes ou muito desatualizados. Então, pensei que seria uma boa ideia identificar

00:03:2620 notários na grande área de Toronto e procurá-los no Google Maps ou nas

00:03:32páginas amarelas canadenses e gerar páginas de destino de alta conversão para cada um deles.

00:03:37E para esta tarefa, o Kimi lançou cinco subagentes, cada um dedicado a uma das subtarefas.

00:03:43E foi interessante ver como os subagentes navegaram realmente pela web e visitaram os

00:03:48sites. E tentaram até estimar se o site está desatualizado ou não usando o seu próprio

00:03:53julgamento. No total, o Kimi demorou cerca de 40 minutos a concluir todo o fluxo de trabalho.

00:03:58Mas no final, o Kimi produziu este relatório de análise muito detalhado sobre todas as descobertas

00:04:03sobre cada um dos sites. E até gerou uma amostra de e-mail de divulgação que eu poderia enviar a potenciais

00:04:09clientes para propostas de sites, juntamente com outro relatório sobre a dimensão global do mercado e o potencial

00:04:16de impacto nas receitas. E, claro, juntamente com isso, obtivemos também todos os ficheiros gerados. E há

00:04:22também uma página dedicada que o Kimi gerou onde posso visualizar cada uma das páginas de destino. E tenho

00:04:27de dizer que todas estas páginas de destino parecem exatamente iguais, o que é um pouco dececionante. Mas talvez

00:04:32tenha sido erro meu por não fornecer um prompt suficientemente detalhado, embora o site deles tivesse

00:04:38o mesmo prompt que usei. Mas talvez tivessem algumas configurações pré-configuradas. Portanto, como tarefa de acompanhamento,

00:04:43pedi ao Kimi para analisar cada uma destas páginas e aplicar um estilo único para cada uma, e também adicionar

00:04:49algumas imagens para tornar as páginas de destino mais interessantes. E aqui podemos ver que o Kimi gerou realmente

00:04:55imagens personalizadas para cada um dos sites. E, como nota engraçada, também notei como o Kimi gosta

00:05:00de se gabar. Por exemplo, aqui, todas as 20 imagens são deslumbrantes. Agora construirei 20 páginas

00:05:06de destino completamente únicas. Quer dizer, ok, Kimi, mas deixa-me ser o juiz disso. Mas, de qualquer forma, o Kimi demorou

00:05:12cerca de 17 minutos a concluir esta tarefa de acompanhamento. E, mais uma vez, vemos aqui o Kimi a gabar-se

00:05:17de que as páginas de destino parecem fantásticas. Ok, Kimi, ok. Então agora temos uma nova página de pré-visualização,

00:05:23mas esta está estranhamente avariada. Provavelmente houve um problema de estilo CSS ou algo do género, mas tudo bem.

00:05:28Vou ignorar isso. Estou mais interessado nas próprias páginas web. Então, as novas páginas parecem muito

00:05:34melhores porque agora temos estas bonitas animações CSS, e cada página web tem agora um cabeçalho com imagem

00:05:40gerada por IA, mas ainda assim, é um bom cabeçalho. Mas também notei que cada uma das páginas

00:05:45segue o mesmo padrão. Temos as mesmas secções, a mesma estrutura de site. Portanto, embora

00:05:51todas estas páginas pareçam diferentes agora, ainda têm o mesmo boilerplate, o que é um pouco

00:05:56dececionante porque eu esperava realmente uma abordagem mais única. Mas este é um bom começo

00:06:02ainda assim. Como podem ver por este exemplo, podem basicamente lançar a vossa própria pequena agência web

00:06:07em 40 minutos usando esta funcionalidade do Kimi. Basta pedir ao enxame de agentes do Kimi para percorrer os vossos

00:06:13negócios locais e contactar cada um deles com um site personalizado e um e-mail de divulgação

00:06:18personalizado, e basicamente têm um bom projeto paralelo a decorrer. Imagino que depois deste vídeo, cada pequeno

00:06:25negócio local comece a receber centenas destes e-mails de proposta com sites personalizados

00:06:29gerados por IA. Mas, ei, é o que é. E tenho de notar que para usar esta funcionalidade de enxame

00:06:36de agentes, têm de estar no plano Allegretto deles. Mas também tenho de dizer que estou bastante

00:06:41certo de que é muito mais barato do que pedir ao Claude Code para fazer a mesma tarefa. É apenas uma pena que as estatísticas de

00:06:46utilização do Kimi não nos forneçam mais detalhes sobre quantos tokens foram gastos nesta tarefa gigantesca de 40 minutos.

00:06:53Mas tenho a sensação de que certamente teria esgotado todos os meus limites de utilização até agora

00:06:58se tivesse usado o Claude para fazer a mesma coisa. Portanto, de qualquer forma, esse é o novo e melhorado enxame de agentes. E já

00:07:04agora, se usaram recentemente o enxame de agentes do Kimi para realizar algumas experiências interessantes, partilhem as vossas

00:07:09conclusões nos comentários abaixo. Agora quero testar como o Kimi melhorou em termos de codificação.

00:07:14Eles afirmam que o 2.6 viu melhorias fortes em tarefas de codificação de longo horizonte com generalização

00:07:20fiável. Portanto, para esta tarefa, decidi pedir ao Kimi para criar uma aplicação web simples com um front-end

00:07:26e uma interface de back-end que também lida com web scraping. Portanto, provavelmente todos ouvimos como os preços da RAM

00:07:31se tornaram insanamente caros nos últimos meses. Então, pensei que seria uma boa ideia

00:07:36criar um site de comparação de preços que procura ativamente dados de preços para várias memórias RAM e vos dá

00:07:42uma tabela de comparação para encontrar as opções mais baratas que existem. Portanto, o Kimi demorou cerca de 12 minutos a

00:07:47concluir esta tarefa. E vejo que agora adicionaram realmente um contador de tokens na sua versão CLI mais recente.

00:07:52Portanto, podemos agora acompanhar os nossos gastos reais em tokens, o que é muito bom. Portanto, aqui está o

00:07:59resultado final. E como podem ver aqui, mostra um tema escuro agradável para o site. E podemos alternar

00:08:05entre marcas individuais. E podemos também ver diferentes opções de preços de diferentes lojas para

00:08:11cada uma das memórias RAM. E o que é ainda melhor é que podemos acionar uma atualização ao vivo, que pesquisa ativamente

00:08:16os dados das lojas. É uma pena que não tenha conseguido obter a maioria das imagens dos produtos,

00:08:21mas a maioria da funcionalidade está lá. E também tem uma secção de comparação. Mas não há forma de adicionar

00:08:27nada a ela. Então tive de pedir ao Kimi uma tarefa de acompanhamento para corrigir este problema. E agora temos este botão

00:08:34de adicionar à comparação. E se passarmos para o separador de comparação, obtemos agora esta excelente tabela de comparação

00:08:41de todas as memórias RAM selecionadas. Portanto, isso é muito bom. E olhando para o código, vejo que escolheu

00:08:46construir o site usando Node JS e Express básico. E nem sequer usou React, optando antes por

00:08:53esta versão em JavaScript puro, onde cada alteração modifica diretamente o elemento inner HTML, o que é

00:08:59uma escolha interessante. Mas, ei, se funciona, não me posso queixar. E por último, até adicionou estas funções

00:09:05de scraper que usam axios e cheerio para pesquisar na Amazon, Newegg e Best Buy. Portanto, isso é

00:09:13muito bom. Então, aí têm, pessoal, esse é o novo modelo Kimi K 2.6. E para ser honesto,

00:09:19a julgar por todos os testes que fizemos hoje, eu não diria que é um avanço massivo em relação ao 2.5.

00:09:25Mas existem algumas melhorias de qualidade de vida realmente boas. E aprecio o facto de a

00:09:30Moonshot AI continuar a melhorar a sua plataforma. E também adoro o facto de fornecerem uma alternativa sólida e

00:09:36mais barata a alguns dos gigantes mais caros que existem, como o Claude Code. Portanto, no geral,

00:09:43bom trabalho, Moonshot AI, continuem o bom trabalho. E estou certamente entusiasmado por ver como o Kimi melhora no

00:09:48futuro. E pessoal, se acharam este vídeo útil ou informativo, por favor, digam-me

00:09:53esmagando esse botão de like abaixo do vídeo. E também certifiquem-se de subscrever o nosso canal para

00:09:58não perderem nenhum dos nossos futuros vídeos de análise técnica. Aqui foi o Andres da

00:10:04Better Stack e vejo-vos nos próximos vídeos.

Key Takeaway

O Kimi K 2.6 aprimora a autonomia de agentes IA com um enxame de 300 subagentes, permitindo a execução de projetos full stack e fluxos de trabalho comerciais complexos em questão de minutos com maior eficiência de custos.

Highlights

O modelo Kimi K 2.6 escala horizontalmente para 300 agentes especializados, capazes de executar 4.000 passos coordenados.
Tarefas de engenharia complexas de 13 horas apresentam um ganho de rendimento de 185% com o novo modelo.
O codificador de visão nativo, MoonVIT, processa estruturas de UI e UX para gerar protótipos interativos completos com animações GSAP.
A automação de prospecção de 20 negócios locais, incluindo a criação de páginas de destino personalizadas e e-mails de divulgação, é concluída em 40 minutos.
O modelo suporta fluxos de trabalho full stack, integrando desde a autenticação de usuários até o registro em bancos de dados.
A nova versão CLI do Kimi inclui um contador de tokens, permitindo o acompanhamento preciso dos gastos em tempo real.

Timeline

Atualizações técnicas do Kimi K 2.6

O enxame de agentes cresceu de 100 para 300 subagentes especializados.
O novo modo de pensamento preservado mantém a consistência do raciocínio em fluxos de trabalho longos.
O codificador de visão nativo MoonVIT analisa a estrutura visual para guiar o design orientado por código.

Esta iteração foca em escalar a capacidade de execução paralela, permitindo até 4.000 passos coordenados. O modo de pensamento preservado resolve a deriva de memória comum em tarefas de vários turnos, enquanto o MoonVIT melhora a interpretação de referências visuais para a criação de interfaces.

Automação de agência web para negócios locais

A identificação de 20 potenciais clientes e a criação de páginas de destino foram realizadas em 40 minutos.
O Kimi gera relatórios de mercado, amostras de e-mail de divulgação e páginas interativas com animações CSS.
O uso da funcionalidade de enxame de agentes exige o plano Allegretto.

O processo envolveu o uso de cinco subagentes para buscar dados de empresas no Google Maps e avaliar sites desatualizados. Embora a primeira tentativa tenha gerado modelos repetitivos, o refinamento posterior em 17 minutos produziu páginas únicas com imagens geradas por IA e animações customizadas.

Codificação e comparação de preços

A criação de um comparador de preços com web scraping foi concluída em 12 minutos.
O sistema utiliza Node.js, Express e JavaScript puro para realizar buscas ativas na Amazon, Newegg e Best Buy.
O modelo implementa funcionalidades de front-end, como temas escuros e tabelas de comparação, via solicitações de acompanhamento.

O teste de codificação demonstrou a capacidade de criar uma aplicação web funcional com back-end de scraping. O Kimi optou por uma arquitetura de JavaScript puro que modifica o DOM diretamente, mantendo a eficiência do código enquanto atende a requisitos específicos de comparação de produtos.

Community Posts

Write about this video