¡Kimi K2.6 puede iniciar un negocio en 40 minutos! (Análisis completo del modelo)
BBetter Stack
Computing/SoftwareAdvertising/MarketingSmall Business/StartupsInternet Technology
Transcript
00:00:00Como pueden ver en este ejemplo, básicamente pueden iniciar su propia pequeña agencia web
00:00:04de negocios en 40 minutos usando esta función de Kimi.
00:00:07Bueno, amigos, Moonshot AI está de vuelta con otra actualización de su modelo insignia, Kimi.
00:00:13Kimi K 2.6 es su modelo más reciente, que promete una programación de vanguardia,
00:00:18ejecución a largo plazo y capacidades de enjambre de agentes.
00:00:22En el video de hoy, vamos a echar un vistazo a este nuevo modelo, ver cómo se desempeña en diferentes
00:00:27tareas agentivas y descubrir si es realmente tan impresionante como se anuncia.
00:00:32Será muy divertido, así que sumerjámonos en ello.
00:00:34Hace unos meses, revisé Kimi K 2.5 y funcionó muy bien en diseño front-end.
00:00:44Y quedé genuinamente impresionado por su función de enjambre de agentes.
00:00:48También me encantó el hecho de que pusieron mucho esfuerzo en la UX de su propia página de chat.
00:00:54Así que, en esta siguiente iteración, Kimi promete algunos saltos bastante masivos
00:00:57en cómo usamos realmente los agentes de IA en un entorno de producción.
00:01:02Primero, el enjambre de agentes básicamente se ha triplicado.
00:01:05En K 2.5, estábamos viendo unos 100 subagentes, pero K 2.6 escala esto horizontalmente
00:01:12a 300 agentes especializados que pueden ejecutar hasta 4,000 pasos coordinados.
00:01:18Así que, esta es una actualización bastante masiva.
00:01:20Así que, ahora pueden ejecutar más tareas en paralelo al mismo tiempo.
00:01:24También agregaron un nuevo modo de pensamiento preservado,
00:01:26que mantiene el rastro de razonamiento del modelo consistente a través de tareas de varios turnos.
00:01:31Detiene la deriva de memoria que suele ocurrir cuando estás inmerso en un flujo de trabajo complejo.
00:01:36Y luego tenemos las tareas de largo alcance.
00:01:39Y en sus propias pruebas, logró una tarea de ingeniería de 13 horas con un aumento de rendimiento del 185%.
00:01:46Y cuando se trata de estética, se ha movido hacia el diseño basado en código.
00:01:51En lugar de solo hacer una bonita página de aterrizaje, K 2.6 usa su propio codificador de visión nativo
00:01:57llamado MoonVIT para razonar sobre las estructuras de UI y UX a un nivel más profundo.
00:02:03Ahora puede manejar flujos de trabajo full stack desde la autenticación hasta el registro en la base de datos,
00:02:08convirtiendo una referencia visual única o un prompt en un prototipo interactivo completamente funcional
00:02:14con animaciones GSAP, efectos activados por scroll y todo tipo de maravillas.
00:02:19Y por cierto, todo esto es de código abierto, incluido el codificador de visión.
00:02:23Así que, si quisieran, podrían ejecutarlo de forma independiente,
00:02:26separado de la arquitectura de Kimi si obtienen el modelo de Hugging Face.
00:02:30Así que, todo eso suena muy impresionante, pero probémoslo y veamos cómo se desempeña realmente.
00:02:35Y los modelos de Kimi son de código abierto, así que teóricamente podrías usarlo en cualquier configuración que prefieras.
00:02:40Pero para probar su Enjambre de Agentes, voy a usar su propia interfaz de chat
00:02:46para obtener los mejores resultados. Primero, quiero probar la nueva función de Enjambre de Agentes.
00:02:50Mirando sus ejemplos en su sitio, una cosa realmente llamó mi atención.
00:02:54Fue esta sección donde K 2.6 fue utilizado para identificar 30 tiendas minoristas en Los Ángeles sin
00:03:01sitios web oficiales desde Google Maps y generar páginas de aterrizaje de alta conversión para cada una de ellas.
00:03:06He visto esta tendencia flotando por Instagram, así que quiero probarla y ver si podemos realmente
00:03:11crear nuestra propia pequeña agencia web. Así que, para esta prueba, decidí hacer algo similar.
00:03:16Vivo en Toronto y lo que he notado es que muchas notarías en mi área tienen sitios web
00:03:21inexistentes o muy desactualizados. Así que pensé que sería una buena idea identificar
00:03:2620 notarías en el área metropolitana de Toronto y buscarlas en Google Maps o en las
00:03:32Páginas Amarillas canadienses y generar páginas de aterrizaje de alta conversión para cada una de ellas.
00:03:37Y para esta tarea, Kimi puso en marcha cinco subagentes, cada uno dedicado a una de las subtareas.
00:03:43Y fue interesante ver cómo los subagentes navegaban por la web y visitaban los
00:03:48sitios web. E incluso intentaron estimar si el sitio web estaba desactualizado o no usando su propio
00:03:53juicio. En total, le tomó a Kimi aproximadamente 40 minutos terminar todo el flujo de trabajo.
00:03:58Pero al final, Kimi produjo este informe de análisis muy detallado sobre todos los hallazgos
00:04:03sobre cada uno de los sitios web. E incluso generó una muestra de correo electrónico de acercamiento que podría enviar a posibles
00:04:09clientes para propuestas de sitios web, junto con otro informe del tamaño total del mercado y el potencial de ingresos.
00:04:16Y junto a ello, por supuesto, también obtuvimos todos los archivos generados. Y hay
00:04:22también una página dedicada que Kimi generó donde puedo previsualizar cada una de las páginas de aterrizaje. Y sí
00:04:27tengo que decir que todas estas páginas de aterrizaje se ven exactamente iguales, lo cual es algo decepcionante. Pero tal vez
00:04:32ese fue mi error por no proporcionar un prompt lo suficientemente detallado, aunque su propio sitio web sí tenía
00:04:38el mismo prompt que yo usé. Pero tal vez tenían algunos arneses preconfigurados. Así que, como tarea de seguimiento,
00:04:43le pedí a Kimi que revisara cada una de estas páginas y aplicara un estilo único para cada una de ellas, y también agregara
00:04:49algunas imágenes para hacer las páginas de aterrizaje más emocionantes. Y aquí podemos ver que Kimi realmente generó
00:04:55imágenes personalizadas para cada uno de los sitios. Y como nota divertida, también noté cómo a Kimi le gusta
00:05:00alabarse a sí mismo. Por ejemplo, aquí, todas las 20 imágenes son impresionantes. Ahora construiré 20 páginas de aterrizaje
00:05:06completamente únicas. Digo, está bien, Kimi, pero déjame ser el juez de eso. Pero de todos modos, le tomó a Kimi
00:05:12alrededor de 17 minutos terminar esta tarea de seguimiento. Y una vez más, vemos aquí a Kimi alabándose a sí mismo
00:05:17de que las páginas de aterrizaje se ven fantásticas. Está bien, Kimi, está bien. Así que ahora tenemos una nueva página de vista previa,
00:05:23pero esta está extrañamente rota. Probablemente hubo un problema de estilo CSS o algo así, pero está bien.
00:05:28No le daré importancia. Me interesan más las páginas web en sí mismas. Así que las nuevas páginas sí se ven mucho
00:05:34mejor porque ahora tenemos estas bonitas animaciones CSS, y cada página web ahora tiene un encabezado con imagen
00:05:40generada por IA, pero de todos modos, es un buen encabezado. Pero también noté que cada una de las páginas
00:05:45sigue el mismo patrón. Tenemos las mismas secciones, la misma estructura de sitio. Así que, aunque
00:05:51todas estas páginas se ven diferentes ahora, todavía tienen la misma plantilla, lo cual es algo
00:05:56decepcionante porque realmente esperaba un enfoque más único. Pero este es un buen comienzo
00:06:02de todos modos. Como pueden ver en este ejemplo, básicamente pueden iniciar su propia pequeña agencia web
00:06:07de negocios en 40 minutos usando esta función de Kimi. Solo pídanle al enjambre de agentes de Kimi que revise sus
00:06:13negocios locales y contacte a cada uno de ellos con un sitio web diseñado a medida y un correo electrónico
00:06:18de acercamiento diseñado a medida y básicamente tienen un buen trabajo secundario en marcha. Imagino que después de este video, cada pequeño
00:06:25negocio local empezará a recibir cientos de estos correos de propuesta con sitios web
00:06:29personalizados generados por IA. Pero bueno, es lo que hay. Y debo mencionar que para usar esta función de enjambre de agentes
00:06:36tienes que estar en su plan Allegretto. Pero también debo decir que estoy bastante
00:06:41seguro de que es mucho más barato que pedirle a Claude Code que haga la misma tarea. Es una lástima que las estadísticas de uso de Kimi
00:06:46no nos den más detalles sobre cuántos tokens se gastaron en esta gigantesca tarea de 40 minutos.
00:06:53Pero tengo la sensación de que ciertamente habría agotado todos mis límites de uso para ahora
00:06:58si hubiera usado Claude para hacer lo mismo. Así que bueno, ese es el nuevo y mejorado enjambre de agentes. Y por
00:07:04cierto, si han usado recientemente el enjambre de agentes de Kimi para realizar algunos experimentos interesantes, compartan sus
00:07:09hallazgos en los comentarios a continuación. Ahora quiero probar cómo ha mejorado Kimi en términos de programación.
00:07:14Afirman que la versión 2.6 ha visto fuertes mejoras en tareas de programación de largo alcance con una generalización
00:07:20confiable. Así que, para esta tarea, decidí pedirle a Kimi que creara una aplicación web simple con un front-end
00:07:26y una interfaz de back-end que también maneje web scraping. Probablemente todos hemos escuchado lo increíblemente
00:07:31caros que se han vuelto los precios de la memoria RAM en los últimos meses. Así que pensé que sería una buena idea
00:07:36crear un sitio web de comparación de precios que raspe activamente datos de precios de varias memorias RAM y les dé
00:07:42una tabla comparativa para encontrar las opciones más baratas. Le tomó a Kimi aproximadamente 12 minutos
00:07:47terminar esta tarea. Y veo que ahora realmente han agregado un contador de tokens en su versión CLI
00:07:52más reciente. Así que ahora podemos hacer un seguimiento de nuestro gasto real de tokens, lo cual es genial. Aquí está el
00:07:59resultado final. Y como pueden ver aquí, muestra un bonito tema oscuro para el sitio. Y podemos alternar
00:08:05entre marcas individuales. Y también podemos ver diferentes opciones de precios de distintas tiendas para
00:08:11cada una de las memorias RAM. Y lo que es aún más genial es que podemos activar una actualización en vivo, que realiza el
00:08:16scraping de los datos de la tienda nuevamente. Es una lástima que no pudiera obtener la mayoría de las imágenes de los productos,
00:08:21pero la mayor parte de la funcionalidad está ahí. Y también tiene una sección de comparación. Pero no hay forma de agregar
00:08:27nada a ella. Así que tuve que pedirle a Kimi una tarea de seguimiento para solucionar este problema. Y ahora obtenemos este bonito
00:08:34botón de agregar a comparación. Y si vamos a la pestaña de comparación, ahora tenemos esta genial tabla comparativa
00:08:41de todas las memorias RAM seleccionadas. Así que eso es bastante bueno. Y al mirar el código, veo que eligió
00:08:46construir el sitio usando Node JS y Express básico. Y ni siquiera usó React, sino que optó por
00:08:53esta versión de JavaScript nativo donde cada cambio modifica el elemento inner HTML directamente, lo cual es
00:08:59una elección interesante. Pero bueno, si funciona, no me puedo quejar. Y por último, incluso agregó estas bonitas
00:09:05funciones de scraper que usan axios y cheerio para scrapear Amazon, Newegg y Best Buy. Así que eso es
00:09:13bastante genial. Así que ahí lo tienen, amigos, ese es el nuevo modelo Kimi K 2.6. Y, para ser honesto,
00:09:19a juzgar por todas las pruebas que hemos hecho hoy, no diría que es un salto masivo desde la versión 2.5.
00:09:25Pero hay algunas mejoras de calidad de vida realmente buenas. Y aprecio el hecho de que
00:09:30Moonshot AI sigue mejorando su plataforma mucho. Y también me encanta el hecho de que ofrecen una alternativa sólida
00:09:36más barata a algunos de los gigantes más caros que existen, como Claude Code. Así que, en general,
00:09:43gran trabajo Moonshot AI, sigan con el buen trabajo. Y ciertamente estoy emocionado de ver cómo mejora Kimi en
00:09:48el futuro. Y amigos, si encontraron este video útil o informativo, por favor háganmelo saber
00:09:53golpeando ese botón de me gusta debajo del video. Y también asegúrense de suscribirse a nuestro canal para que
00:09:58no se pierdan ninguno de nuestros futuros videos de análisis técnico. Este ha sido Andrés de
00:10:04Better Stack y los veré en los próximos videos.