O Kimi K2.6 consegue abrir um negócio em 40 minutos! (Análise completa do modelo)
BBetter Stack
Computing/SoftwareAdvertising/MarketingSmall Business/StartupsInternet Technology
Transcript
00:00:00Como podem ver por este exemplo, basicamente podem lançar a vossa própria pequena agência web
00:00:04em 40 minutos usando esta funcionalidade do Kimi.
00:00:07Bem pessoal, a Moonshot AI está de volta com outra atualização do seu principal modelo, o Kimi.
00:00:13O Kimi K 2.6 é o seu modelo mais recente, que promete codificação de última geração,
00:00:18execução de longo horizonte e capacidades de enxame de agentes.
00:00:22No vídeo de hoje, vamos analisar este novo modelo, ver como ele se comporta em diferentes
00:00:27tarefas agentivas e descobrir se é realmente tão impressionante quanto anunciado.
00:00:32Vai ser muito divertido, então vamos mergulhar nisso.
00:00:34Há alguns meses, analisei o Kimi K 2.5 e ele teve um desempenho muito bom no design front-end.
00:00:44E fiquei genuinamente impressionado com a funcionalidade de enxame de agentes deles.
00:00:48Também adorei o facto de terem investido tanto esforço na experiência do utilizador na sua página de chat.
00:00:54Portanto, nesta próxima iteração, o Kimi promete alguns saltos bastante grandes
00:00:57na forma como realmente usamos agentes de IA num ambiente de produção.
00:01:02Primeiro, o enxame de agentes basicamente triplicou.
00:01:05No K 2.5, estávamos a ver cerca de 100 subagentes, mas o K 2.6 escala isto horizontalmente
00:01:12para 300 agentes especializados que podem executar até 4.000 passos coordenados.
00:01:18Portanto, esta é uma atualização bastante massiva.
00:01:20Então, agora podem executar mais tarefas em paralelo ao mesmo tempo.
00:01:24Adicionaram também um novo modo de pensamento preservado,
00:01:26que mantém o rasto de raciocínio do modelo consistente em tarefas de vários turnos.
00:01:31Isso evita a deriva de memória que geralmente acontece quando se está no meio de um fluxo de trabalho complexo.
00:01:36E depois temos as tarefas de longo horizonte.
00:01:39E nos seus próprios testes, ele geriu uma tarefa de engenharia de 13 horas com um ganho de rendimento de 185%.
00:01:46E quando se trata de estética, passou para o design orientado por código.
00:01:51Em vez de apenas criar uma página de destino bonita, o K 2.6 usa o seu próprio codificador de visão nativo
00:01:57chamado MoonVIT para raciocinar sobre estruturas de UI e UX a um nível mais profundo.
00:02:03Agora pode lidar com fluxos de trabalho full stack, desde autenticação até registo em base de dados,
00:02:08transformando uma única referência visual ou um prompt num protótipo interativo totalmente funcional
00:02:14com animações GSAP e efeitos de scroll, e todo o tipo de outras coisas boas.
00:02:19E, aliás, tudo isto é open source, incluindo o codificador de visão.
00:02:23Portanto, se quisessem, poderiam realmente executá-lo de forma independente,
00:02:26desconectado da arquitetura do Kimi se obtiverem o modelo a partir do Hugging Face.
00:02:30Portanto, tudo isto parece muito impressionante, mas vamos testá-lo e ver como funciona realmente.
00:02:35E os modelos do Kimi são open source, por isso poderiam teoricamente usá-lo em qualquer configuração que preferirem.
00:02:40Mas para testar o seu Enxame de Agentes, vou usar a sua própria interface de chat
00:02:46para obter os melhores resultados. Antes de mais, quero experimentar a nova funcionalidade de Enxame de Agentes.
00:02:50Olhando para os exemplos deles no site, uma coisa chamou-me realmente a atenção.
00:02:54Foi esta secção onde o K 2.6 foi usado para identificar 30 lojas de retalho em Los Angeles sem
00:03:01sites oficiais a partir do Google Maps e gerar páginas de destino de alta conversão para cada uma delas.
00:03:06Tenho visto esta tendência a circular no Instagram, por isso quero experimentá-la e ver se conseguimos realmente
00:03:11criar a nossa própria pequena agência web. Então, para este teste, decidi fazer algo semelhante.
00:03:16Eu vivo em Toronto e o que tenho notado é que muitos notários na minha área têm sites
00:03:21inexistentes ou muito desatualizados. Então, pensei que seria uma boa ideia identificar
00:03:2620 notários na grande área de Toronto e procurá-los no Google Maps ou nas
00:03:32páginas amarelas canadenses e gerar páginas de destino de alta conversão para cada um deles.
00:03:37E para esta tarefa, o Kimi lançou cinco subagentes, cada um dedicado a uma das subtarefas.
00:03:43E foi interessante ver como os subagentes navegaram realmente pela web e visitaram os
00:03:48sites. E tentaram até estimar se o site está desatualizado ou não usando o seu próprio
00:03:53julgamento. No total, o Kimi demorou cerca de 40 minutos a concluir todo o fluxo de trabalho.
00:03:58Mas no final, o Kimi produziu este relatório de análise muito detalhado sobre todas as descobertas
00:04:03sobre cada um dos sites. E até gerou uma amostra de e-mail de divulgação que eu poderia enviar a potenciais
00:04:09clientes para propostas de sites, juntamente com outro relatório sobre a dimensão global do mercado e o potencial
00:04:16de impacto nas receitas. E, claro, juntamente com isso, obtivemos também todos os ficheiros gerados. E há
00:04:22também uma página dedicada que o Kimi gerou onde posso visualizar cada uma das páginas de destino. E tenho
00:04:27de dizer que todas estas páginas de destino parecem exatamente iguais, o que é um pouco dececionante. Mas talvez
00:04:32tenha sido erro meu por não fornecer um prompt suficientemente detalhado, embora o site deles tivesse
00:04:38o mesmo prompt que usei. Mas talvez tivessem algumas configurações pré-configuradas. Portanto, como tarefa de acompanhamento,
00:04:43pedi ao Kimi para analisar cada uma destas páginas e aplicar um estilo único para cada uma, e também adicionar
00:04:49algumas imagens para tornar as páginas de destino mais interessantes. E aqui podemos ver que o Kimi gerou realmente
00:04:55imagens personalizadas para cada um dos sites. E, como nota engraçada, também notei como o Kimi gosta
00:05:00de se gabar. Por exemplo, aqui, todas as 20 imagens são deslumbrantes. Agora construirei 20 páginas
00:05:06de destino completamente únicas. Quer dizer, ok, Kimi, mas deixa-me ser o juiz disso. Mas, de qualquer forma, o Kimi demorou
00:05:12cerca de 17 minutos a concluir esta tarefa de acompanhamento. E, mais uma vez, vemos aqui o Kimi a gabar-se
00:05:17de que as páginas de destino parecem fantásticas. Ok, Kimi, ok. Então agora temos uma nova página de pré-visualização,
00:05:23mas esta está estranhamente avariada. Provavelmente houve um problema de estilo CSS ou algo do género, mas tudo bem.
00:05:28Vou ignorar isso. Estou mais interessado nas próprias páginas web. Então, as novas páginas parecem muito
00:05:34melhores porque agora temos estas bonitas animações CSS, e cada página web tem agora um cabeçalho com imagem
00:05:40gerada por IA, mas ainda assim, é um bom cabeçalho. Mas também notei que cada uma das páginas
00:05:45segue o mesmo padrão. Temos as mesmas secções, a mesma estrutura de site. Portanto, embora
00:05:51todas estas páginas pareçam diferentes agora, ainda têm o mesmo boilerplate, o que é um pouco
00:05:56dececionante porque eu esperava realmente uma abordagem mais única. Mas este é um bom começo
00:06:02ainda assim. Como podem ver por este exemplo, podem basicamente lançar a vossa própria pequena agência web
00:06:07em 40 minutos usando esta funcionalidade do Kimi. Basta pedir ao enxame de agentes do Kimi para percorrer os vossos
00:06:13negócios locais e contactar cada um deles com um site personalizado e um e-mail de divulgação
00:06:18personalizado, e basicamente têm um bom projeto paralelo a decorrer. Imagino que depois deste vídeo, cada pequeno
00:06:25negócio local comece a receber centenas destes e-mails de proposta com sites personalizados
00:06:29gerados por IA. Mas, ei, é o que é. E tenho de notar que para usar esta funcionalidade de enxame
00:06:36de agentes, têm de estar no plano Allegretto deles. Mas também tenho de dizer que estou bastante
00:06:41certo de que é muito mais barato do que pedir ao Claude Code para fazer a mesma tarefa. É apenas uma pena que as estatísticas de
00:06:46utilização do Kimi não nos forneçam mais detalhes sobre quantos tokens foram gastos nesta tarefa gigantesca de 40 minutos.
00:06:53Mas tenho a sensação de que certamente teria esgotado todos os meus limites de utilização até agora
00:06:58se tivesse usado o Claude para fazer a mesma coisa. Portanto, de qualquer forma, esse é o novo e melhorado enxame de agentes. E já
00:07:04agora, se usaram recentemente o enxame de agentes do Kimi para realizar algumas experiências interessantes, partilhem as vossas
00:07:09conclusões nos comentários abaixo. Agora quero testar como o Kimi melhorou em termos de codificação.
00:07:14Eles afirmam que o 2.6 viu melhorias fortes em tarefas de codificação de longo horizonte com generalização
00:07:20fiável. Portanto, para esta tarefa, decidi pedir ao Kimi para criar uma aplicação web simples com um front-end
00:07:26e uma interface de back-end que também lida com web scraping. Portanto, provavelmente todos ouvimos como os preços da RAM
00:07:31se tornaram insanamente caros nos últimos meses. Então, pensei que seria uma boa ideia
00:07:36criar um site de comparação de preços que procura ativamente dados de preços para várias memórias RAM e vos dá
00:07:42uma tabela de comparação para encontrar as opções mais baratas que existem. Portanto, o Kimi demorou cerca de 12 minutos a
00:07:47concluir esta tarefa. E vejo que agora adicionaram realmente um contador de tokens na sua versão CLI mais recente.
00:07:52Portanto, podemos agora acompanhar os nossos gastos reais em tokens, o que é muito bom. Portanto, aqui está o
00:07:59resultado final. E como podem ver aqui, mostra um tema escuro agradável para o site. E podemos alternar
00:08:05entre marcas individuais. E podemos também ver diferentes opções de preços de diferentes lojas para
00:08:11cada uma das memórias RAM. E o que é ainda melhor é que podemos acionar uma atualização ao vivo, que pesquisa ativamente
00:08:16os dados das lojas. É uma pena que não tenha conseguido obter a maioria das imagens dos produtos,
00:08:21mas a maioria da funcionalidade está lá. E também tem uma secção de comparação. Mas não há forma de adicionar
00:08:27nada a ela. Então tive de pedir ao Kimi uma tarefa de acompanhamento para corrigir este problema. E agora temos este botão
00:08:34de adicionar à comparação. E se passarmos para o separador de comparação, obtemos agora esta excelente tabela de comparação
00:08:41de todas as memórias RAM selecionadas. Portanto, isso é muito bom. E olhando para o código, vejo que escolheu
00:08:46construir o site usando Node JS e Express básico. E nem sequer usou React, optando antes por
00:08:53esta versão em JavaScript puro, onde cada alteração modifica diretamente o elemento inner HTML, o que é
00:08:59uma escolha interessante. Mas, ei, se funciona, não me posso queixar. E por último, até adicionou estas funções
00:09:05de scraper que usam axios e cheerio para pesquisar na Amazon, Newegg e Best Buy. Portanto, isso é
00:09:13muito bom. Então, aí têm, pessoal, esse é o novo modelo Kimi K 2.6. E para ser honesto,
00:09:19a julgar por todos os testes que fizemos hoje, eu não diria que é um avanço massivo em relação ao 2.5.
00:09:25Mas existem algumas melhorias de qualidade de vida realmente boas. E aprecio o facto de a
00:09:30Moonshot AI continuar a melhorar a sua plataforma. E também adoro o facto de fornecerem uma alternativa sólida e
00:09:36mais barata a alguns dos gigantes mais caros que existem, como o Claude Code. Portanto, no geral,
00:09:43bom trabalho, Moonshot AI, continuem o bom trabalho. E estou certamente entusiasmado por ver como o Kimi melhora no
00:09:48futuro. E pessoal, se acharam este vídeo útil ou informativo, por favor, digam-me
00:09:53esmagando esse botão de like abaixo do vídeo. E também certifiquem-se de subscrever o nosso canal para
00:09:58não perderem nenhum dos nossos futuros vídeos de análise técnica. Aqui foi o Andres da
00:10:04Better Stack e vejo-vos nos próximos vídeos.