DEJA de usar Claude Code sin este Fable 5 Agentic OS

Españolالعربية Deutsch English Français हिन्दी Bahasa Indonesia 日本語 한국어 Português Русский 中文

컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00Oye, Jarvis, dame el resumen de hoy.

00:00:03Buenos días.

00:00:04Tienes unos 466,000 seguidores en todas las plataformas, un aumento de unos 3,000 esta semana.

00:00:12Los últimos videos están obteniendo unas 4,000 visitas al día, 17,000 hasta ahora.

00:00:18Gran noticia en IA hoy, una directiva del gobierno de EE. UU. obligó a Anthropic a suspender el acceso público a su clase superior Mythos.

00:00:27Lo más importante en la agenda de hoy, editar y publicar el video de revelación del HUD de Jarvis.

00:00:33¿Quieres que realice la auditoría diaria de la bandeja de entrada o tienes algo más en mente?

00:00:37¿Entonces, qué es exactamente lo que estamos viendo aquí?

00:00:39Bueno, este es Jarvis, nuestro SO Claude Fable 5.

00:00:43Ahora, cuando decimos Fable 5, quiero decir que esto fue construido usando Fable 5, pero no requiere que tengamos Fable 5 para ejecutarlo.

00:00:51De hecho, mucho de lo que ves aquí es completamente local, y puede ejecutarse prácticamente en cualquier modelo que desees.

00:00:58Ahora, si has visto mis videos anteriores sobre el SO Agéntico, ya conoces el tema.

00:01:01Hemos tomado Cloud Code y le hemos añadido otra capa encima, que nos da cosas que simplemente no puedes obtener dentro de la terminal.

00:01:08Cosas como métricas visuales, cosas como habilidades que se convierten en botones, y esto no es un teatro de productividad.

00:01:15Esto es algo que nos da un verdadero impulso si somos personas que operan en muchos dominios diferentes, y también es algo que podemos empaquetar fácilmente para clientes o miembros de nuestro equipo que no son particularmente técnicos.

00:01:26Y Jarvis es solo la próxima evolución de este modelo de SO Agéntico.

00:01:30Su columna vertebral sigue siendo esta robusta y completamente personalizable arquitectura de habilidades de Claude Code, que toma todo lo que haces en tu día a día, tus flujos de trabajo manuales, tus tareas diarias, y los convierte en habilidades y automatizaciones.

00:01:43Y es sobre esa base que construimos esto.

00:01:46Y en el video de hoy, voy a mostrarte cómo funciona, dónde reside el verdadero valor, y cómo puedes crear algo así para ti mismo.

00:01:53Y creo que hay muchas cosas que puedes sacar de este proyecto, especialmente la dinámica del modelo de voz local que tenemos.

00:01:58Antes de sumergirnos en todo eso, una breve palabra de nuestro patrocinador de hoy, yo mismo.

00:02:02Dentro de Chase AI+, no solo tienes acceso a mi configuración exacta que ves en el video de hoy, también obtienes la clase maestra de Claude Code, que es la mejor manera de pasar de cero a desarrollador de IA, especialmente si no vienes de un entorno técnico.

00:02:14Actualizo esto cada semana, y también incluye una clase maestra de Codex.

00:02:18Así que si eres alguien que intenta estar a la vanguardia de la IA, este es el lugar para ti.

00:02:23Actualmente estamos ofreciendo algunas ofertas en la suscripción, así que si quieres echar un vistazo, solo revisa el comentario fijado.

00:02:28Así que comencemos con un rápido panorama de Jarvis para que puedas entender lo que estás viendo aquí.

00:02:34Después de eso, echaremos un vistazo bajo el capó, veremos cómo funciona realmente, para que entiendas cómo personalizarlo y construirlo tú mismo.

00:02:41Así que, en primer lugar, tenemos el aspecto de voz, de nuevo, completamente local, lo que le permite ser relativamente rápido y ágil en comparación con enrutar todo esto a través de algo como 11Labs, por ejemplo.

00:02:53Y al comienzo de este video, escuchaste a Jarvis darme todo un discurso sobre lo que está pasando con mis últimos videos, lo que sucede con mi cuenta de seguidores, noticias de IA, ese tipo de cosas.

00:03:01Eso no es un guion preprogramado.

00:03:03Lo que sucede es que cuando le pregunto a Jarvis, oye, dame el resumen de hoy o qué está pasando hoy, analiza los diversos informes que se generan automáticamente dentro de mi Obsidian Vault y determina qué es realmente importante de esos informes y qué debería saber.

00:03:18Mientras hacía eso, recordarás que hubo varias ventanas emergentes, y estas pequeñas ventanas son informes o enlaces a cosas que son relevantes según lo que te está contando.

00:03:29Así que recuerda, dijo algo como, oye, tu último video está funcionando así y asá, así que tiene esta ventana emergente de despliegue reciente, que me lleva a dicho video.

00:03:37Menciona cosas sobre Anthropic, sabes, esencialmente que el gobierno canceló Fable 5.

00:03:42¿Qué hace?

00:03:43Trae el artículo fuente para eso.

00:03:44También habló sobre más cosas relacionadas con las noticias de IA y lo que es tendencia, y todo eso provino del informe de la mañana.

00:03:49Así que si hago clic aquí, verás este informe completo.

00:03:52Este informe vive dentro de Obsidian.

00:03:54Todo este sistema está vinculado a Obsidian.

00:03:56Así que aunque puedo leerlo aquí mismo, también puedo hacer clic en Abrir en Obsidian, y trae el informe original dentro de Obsidian.

00:04:04Puedo hacer clic en los diferentes enlaces, así que hay una conexión completa.

00:04:07También recordarás que al final de su discurso preguntó, oye, ¿quieres que haga esa clasificación de bandeja de entrada por ti?

00:04:12¿Quieres que entre en tu Gmail y vea qué es importante, a qué tenemos que responder?

00:04:15Bueno, eso es una habilidad, y esas habilidades y automatizaciones están representadas aquí a la derecha.

00:04:21Esto me permite ejecutar al instante cualquier habilidad o automatización de Cloud Code con solo hacer clic en un botón.

00:04:26Y, de nuevo, si recuerdan lo que hicimos con nuestro Cloud OS que creamos en Obsidian la otra semana, es exactamente la misma idea.

00:04:33El valor añadido aquí es más por si utilizan esto con un equipo no técnico o un cliente no técnico,

00:04:39y quieren poder ejecutar habilidades y automatizaciones con Cloud Code, pero no son del tipo que abre la terminal.

00:04:44Esto les permite obtener todo ese poder con un clic de un botón y, de nuevo, totalmente personalizable.

00:04:49Así que digamos que quiero obtener un informe completo de la bandeja de entrada.

00:04:52Si simplemente hago clic en informe de bandeja de entrada aquí arriba a la derecha, puedes ver que menciona que está en cola de inmediato.

00:05:00Lo vemos aquí, y luego también vemos una nueva ventana emergente que muestra el informe de la bandeja de entrada, y obtenemos una pequeña barra de progreso que muestra que está trabajando en dicha automatización.

00:05:09Y una vez que termine, no solo generará un informe escrito, sino que puede darme un resumen verbal de, oye, esto es lo que está pasando, esto es lo que debería importarte.

00:05:16Así que me dio el resumen verbal rápido de lo que encontró, y luego puedo ver el informe real, que de nuevo, como siempre, está vinculado dentro de Obsidian.

00:05:34Así que estas ventanas emergentes son útiles, son relevantes, y nos vinculan a cosas que realmente nos importan, y en cualquier momento puedo borrarlas.

00:05:39Ahora miremos aquí a la derecha un poco más.

00:05:41Ya hablé un poco de esto.

00:05:43Tenemos estas diferentes habilidades que podemos cambiar en cualquier momento.

00:05:45A un clic de distancia, las ejecuta.

00:05:47Debajo de eso, tenemos el horario.

00:05:50Así que esto es solo mi horario diario que está vinculado a mi Google Calendar.

00:05:53Si hago clic, abre mi calendario.

00:05:56Tenemos una pequeña sección de audio.

00:05:58Así que si estabas prestando atención cuando estaba hablando, podíamos verlo moverse hacia arriba y hacia abajo, y simplemente te hace saber si está funcionando realmente.

00:06:05Y debajo de eso, tenemos un resumen de lo que está pasando en términos de noticias de IA.

00:06:10Ahora, todo lo que ves aquí, junto con todo lo que hablamos, es completamente personalizable.

00:06:15Quizás no te importa tener tu horario de Google Calendar aquí.

00:06:18Quizás no te importa mostrar el audio o tener un flujo de noticias de IA.

00:06:21Está bien.

00:06:22La belleza de estos sistemas de SO agéntico es el hecho de que no es un tamaño único para todos.

00:06:29Este es solo un conjunto de herramientas que te estoy mostrando que puedes tomar y hacer lo que quieras con ellas.

00:06:34Sabes, tus métricas serán diferentes a mis métricas.

00:06:36El tipo de cosas que quieres tener a un clic de distancia serán muy diferentes de las mías.

00:06:40Todo depende de tus flujos de trabajo diarios y de lo que tú o tu negocio hagan.

00:06:44Pero lo positivo de algo como esto es que cuando hablamos de crear esto para clientes o incluso miembros del equipo, puedes hacerlo lo que quieras que sea para ellos.

00:06:51Aquí en el lado izquierdo, es lo mismo.

00:06:53Para mis vitales, muestro cosas como mis conteos de suscriptores, qué está pasando con mi último video.

00:06:58Tengo un pequeño rastreador para mis tokens de Claude en las últimas cinco horas.

00:07:01Y algunas cosas como directivas.

00:07:03Así que las directivas son solo como, oye, aquí están las tres cosas principales en las que deberías estar trabajando hoy.

00:07:06De nuevo, totalmente dinámico y Claude Code lo averigua según mi horario.

00:07:10Y luego tengo un pequeño rastro de documentos.

00:07:13Así que todo lo que es creado o referenciado por Jarvis no solo aparece como una ventana emergente.

00:07:18Está aquí.

00:07:18Así que si quiero hacer clic, de nuevo, como el informe de la mañana, está ahí mismo.

00:07:22Esa es la interfaz de usuario.

00:07:23Ese es el lado visual de Jarvis.

00:07:25Ahora hablemos de las tuercas y los tornillos reales.

00:07:28Qué está pasando realmente bajo el capó aquí.

00:07:29Porque eso es lo que realmente importa, seamos honestos.

00:07:32Si nos detuviéramos aquí y fuera solo una interfaz elegante, bueno, de nuevo, solo estamos hablando de teatro de productividad.

00:07:37Si esto va a ser algo que realmente mueva la aguja frente a estar sentado en la terminal todo el tiempo, necesita una base adecuada.

00:07:43Y eso es lo que estamos viendo aquí.

00:07:45Así que caminemos a través de lo que sucede cuando hablas con Jarvis y le pides que haga algo porque puede ir por varios caminos diferentes.

00:07:53Así que aquí estás, y digamos que le dices a Jarvis, dame una actualización sobre el informe de esta mañana.

00:08:00Tienes algún tipo de automatización que ejecutas cada mañana.

00:08:03Toma cualquier información que sea relevante para ti, y quieres que Jarvis te cuente sobre ello.

00:08:07No quieres leerlo.

00:08:07Quieres que realmente la ejecute o si ya se ha ejecutado, que te cuente sobre ello.

00:08:12Así que le dices audiblemente eso a Jarvis, oye, ¿qué está pasando en el informe de hoy?

00:08:18Esa voz, porque de nuevo, usaste tu micrófono para esto, ese audio va a Faster Whisper.

00:08:25Ahora, Faster Whisper es un programa gratuito de origen local que va a tomar lo que hablaste y lo va a transcribir.

00:08:34Ahora, hay un millón y un diferentes, ya sabes, transcriptores de audio locales.

00:08:39Puedes reemplazar esto con lo que quieras.

00:08:40Este es solo el que elegí porque funciona bien.

00:08:42Así que está tomando tu voz y la ha convertido en una transcripción.

00:08:46Ahora, ¿qué hacemos con esto?

00:08:47Porque hemos hablado un poco sobre Fable 5 y todas estas cosas.

00:08:50¿Cada transcripción debe enviarse a Cloud Code, ejecutar Fable 5 y que lo analice?

00:08:55No, por supuesto que no.

00:08:56Todo esto está construido con Fable 5, pero la mayoría de las cosas que se ejecutan bajo el capó van a ser Opus o Sonnet,

00:09:02o francamente, podrías usar un modelo local para muchas de estas cosas porque Jarvis no es, aunque puede hacerlo,

00:09:08puedes decirle que use Fable y lo usas perfectamente bien.

00:09:11No es como si estuvieras creando proyectos a partir de esto.

00:09:13Esto está más en el ámbito del asistente personal o para un equipo no técnico que solo quiere que haga

00:09:17muchas de las cosas similares todo el tiempo con una interfaz de usuario agradable y fácil de entender.

00:09:22Así que solo, eso es como el panorama general.

00:09:24Pero entonces hemos tomado lo que hablaste, lo hemos convertido en una transcripción.

00:09:26Ahora tenemos que averiguar qué hacer con ella.

00:09:28Y tenemos tres opciones.

00:09:30Ahora, la primera pregunta que se hará es, ¿podemos enrutar esta transcripción o esta pregunta a través de expresiones regulares o regex?

00:09:39Así que lo que sucederá es que este script, este trozo de código determinista, la IA no está involucrada aquí,

00:09:45va a mirar tu transcripción y decir, hmm, ¿coincidió con algunas de estas frases precodificadas específicas

00:09:52que sabemos que necesitan hacer algo automáticamente?

00:09:55¿Qué queremos decir con eso?

00:09:56Bueno, en la introducción, ¿qué dije?

00:09:58Dije el resumen para hoy, ¿verdad?

00:10:00Usé el término resumen.

00:10:03Resumen es una palabra de activación específica, por así decirlo, que regex detecta y enruta automáticamente para hacer algo específico.

00:10:11Y esa cosa específica es lo que escuchaste al principio.

00:10:14Echa un vistazo a los informes, dime qué está pasando, dame un resumen para el día, ¿verdad?

00:10:19Un resumen básico, así que automáticamente captura esa palabra clave y hace algo específico.

00:10:24Nos gusta esto porque, como es solo código, no nos cuesta dinero, la IA no está involucrada, y es muy, muy rápido, ¿verdad?

00:10:32En un mundo perfecto, podríamos hacer todo así, y tendríamos respuestas muy, muy rápidas.

00:10:36Pero eso no es todo, porque la mayoría de las veces lo que le pides al sistema de IA que haga puede ser un poco oscuro, ¿verdad?

00:10:43Requiere un poco de inteligencia para averiguar qué hacer y cómo enrutarlo.

00:10:47Y ahí es donde entra la opción dos, y es donde traemos a Haiku.

00:10:51Ahora, ¿por qué estamos usando Haiku?

00:10:52¿Por qué estamos usando el modelo de Anthropic más tonto que existe?

00:10:54Bueno, porque es barato y es rápido.

00:10:57Lo que estamos haciendo aquí en toda esta sección es simplemente enrutar.

00:11:01No estoy haciendo nada a menos que sean expresiones regulares que sé que puedo enrutar de inmediato.

00:11:06Solo estamos tratando de averiguar en esta fase a dónde debe ir esta respuesta y quién debe hacerlo.

00:11:11Así que Haiku es realmente bueno en esto.

00:11:13La mayoría de las cosas que le pedirás a Jarvis que haga no son demasiado complicadas.

00:11:18Solo necesita entender qué camino tomar, y Haiku lo averigua por nosotros.

00:11:22De nuevo, estamos hablando de fracciones de un centavo por cada solicitud.

00:11:26Ahora, la tercera opción, y una que incluyo en mi sistema, pero, ya sabes, depende de lo que quieras hacer, es que esto sea un modelo completamente local.

00:11:34No tienes que usar Haiku en absoluto.

00:11:35Puedes usar un modelo en tu computadora local, que, de nuevo, se inclina hacia el lado local de todo este sistema, y hace lo mismo.

00:11:42Va a echar un vistazo a la transcripción para averiguar cómo enrutarla.

00:11:45Solo estamos enrutando aquí.

00:11:46Así que para resumir, hablas, se transcribe, y luego usamos expresiones regulares, Haiku, o un modelo local para averiguar qué hacer con ello.

00:11:54Así que alejándonos aquí, ahora le hemos dado a Jarvis esa solicitud.

00:11:59Dime qué está pasando en el informe de la mañana.

00:12:01Así que lo que va a suceder es que Haiku va a decir, está bien, echemos un vistazo a Obsidian.

00:12:06¿Esto ya existe?

00:12:08Si este es un informe que ya está en el disco, bueno, eso es algo que podemos ver, leer y responder de manera muy rápida y fácil.

00:12:16Si no existe dentro de Obsidian, bueno, ¿qué va a hacer?

00:12:19Bueno, entonces le va a decir a Claude Code que cree el informe de la mañana.

00:12:24Ahora, de nuevo, Haiku lo está enrutando, pero Haiku no va a ser el que ejecute esto.

00:12:28Queremos un modelo más fuerte.

00:12:30Así que, por defecto, será Opus, pero podrías cambiar eso a Sonnet.

00:12:34Y si estás loco, podrías cambiar eso a Fable 5 cuando eventualmente regrese.

00:12:38Así que si no se ha creado todavía, ¿qué vamos a hacer?

00:12:42Tenemos una versión sin cabeza de Claude Code.

00:12:44Es como abrir Claude Code, pero es invisible.

00:12:47Y usa dash P.

00:12:49Ahora, de nota, usar Claude Code sin cabeza con dash P en un día más o menos no va a tirar de tu suscripción.

00:12:57¿Está bien?

00:12:57Va a tirar de esos $200, como créditos API adicionales que te dan cada mes.

00:13:02¿Puede eso ser un problema?

00:13:04¿A gran escala?

00:13:05Sí.

00:13:06Que es por lo que quieres hacer muchas de estas cosas con Sonnet.

00:13:10¿Va a ser un problema en realidad?

00:13:13Yo diría que realmente no.

00:13:15¿Cuál es el propósito de algo como Jarvis?

00:13:17Es actuar como este asistente personal, como administrador de tareas.

00:13:21No estamos construyendo Facebook con Jarvis.

00:13:24Sabes, si realmente estuvieras haciendo eso, estarías incondicionalmente en la terminal.

00:13:27Esto es para cosas de tipo asistente personal, cosas para miembros de equipo no técnicos.

00:13:31A cierta complejidad, no usarías esto.

00:13:33Esta no es la herramienta para el trabajo.

00:13:35Dicho esto, debido a eso, ¿es probable que gastes $200 en créditos si estás usando Sonnet en su mayor parte?

00:13:44Yo diría que no.

00:13:46No es un gran problema, pero algo en lo que pensar.

00:13:48Y de nuevo, si eso es un problema para ti, entonces simplemente no uses Cloud Code para esto.

00:13:52Esto se llama Fable 5 OS, pero seamos honestos.

00:13:55Podrías reemplazar eso con Codex.

00:13:56Podrías reemplazar todo esto con modelos locales.

00:13:59Sabes, no tiene que ser Cloud Code.

00:14:02La infraestructura es personalizable y se puede cambiar por lo que quieras.

00:14:07Pero volviendo a nuestro ejemplo, decíamos que queríamos el informe de la mañana.

00:14:10No estaba dentro de Obsidian, así que ahora va a generar una versión headless de Cloud Code para crear el informe por nosotros.

00:14:16Ese informe luego se sube a Obsidian, lee el informe y luego genera una respuesta con ese resumen.

00:14:25Ese resumen va a Kokoro.

00:14:29Kokoro es otro modelo local de código abierto que va a tomar el resumen de la transcripción que Cloud Code ha creado y lo convertirá en palabras, lo convertirá en una voz.

00:14:39Piensa en ello como un mini-11 labs en nuestra computadora.

00:14:43Entonces Kokoro dirá, oye, en el informe matutino de hoy, bla, bla, bla, bla, bla, y eso llega hasta ti.

00:14:49La voz que escuchaste hoy con Jarvis es de Kokoro.

00:14:53Eso podría cambiarse por cualquier voz que quieras.

00:14:55Así que, de nuevo, local y personalizable.

00:14:56Pero así es como funciona todo esto, en términos de que le pides a Jarvis que haga algo, y ahí es a donde va la ruta.

00:15:04Así que, para resumir una vez más, ya que estoy seguro de que muchos de ustedes están muy confundidos, ¿qué sucede?

00:15:10Le pides a Jarvis que haga algo.

00:15:13Esa petición necesita ser convertida en una transcripción.

00:15:16Faster Whisper hace esto gratis.

00:15:18Una vez que tenemos la transcripción, tenemos que averiguar, ¿cómo enrutamos esto?

00:15:22Usamos expresiones regulares, un modelo Haiku barato o un modelo local.

00:15:28A partir de ahí, normalmente necesitamos averiguar, ¿es algo que ya existe en Obsidian, o necesitamos recurrir a Cloud Code para generar este informe, esta solicitud para nosotros?

00:15:38Una vez que genera lo que necesita generar, ya sea que cree un informe dentro de Obsidian, o tal vez sea una página HTML.

00:15:44De cualquier manera, va a hacer lo que tiene que hacer, va a enviar la respuesta a Kokoro, que la convierte en una voz que podemos escuchar, y eso regresa a nosotros.

00:15:53Bastante simple.

00:15:54Ahora, yendo un paso más allá, todo lo que realmente está pasando bajo el capó.

00:15:57Cuando decimos informe matutino, cuando decimos hacer la habilidad A, B y C, ¿de qué estamos hablando realmente?

00:16:01Bueno, estamos hablando de esto.

00:16:03Estamos hablando de la arquitectura de habilidades que realmente es la columna vertebral de todo.

00:16:08Porque, ¿qué es un informe matutino?

00:16:09Bueno, eso podría significar cualquier cosa.

00:16:10Lo que es, es una habilidad que se compone de otras habilidades en miniatura que me dan un informe grande diciendo, ve a revisar estas fuentes para esta información, ve a revisar estas páginas de redes sociales para obtener esta información, etcétera, etcétera, etcétera.

00:16:24Pero, como sigo insistiendo, esta arquitectura de habilidades es tan fuerte como tú la hagas.

00:16:30Y ¿cómo hacemos esto?

00:16:31Y si has visto mis otros videos, ya conoces mi discurso sobre esto.

00:16:34Lo que necesitas hacer es encontrar una manera de tomar tus flujos de trabajo diarios.

00:16:38Cuando digo tus flujos de trabajo diarios, ¿qué estoy diciendo?

00:16:40Estoy diciendo, ¿qué haces día a día en tu vida personal o en tu negocio?

00:16:43Como, ¿cuáles son esas tareas comunes que se repiten una y otra vez?

00:16:47Has, alguien a este punto que probablemente sepa cómo usar Cloud Code, ¿te has sentado realmente con Cloud Code y has dicho, oye, esto es lo que hago todos los días.

00:16:55¿Podemos desglosar todo eso en tareas individuales?

00:16:58Y luego, ¿podemos convertir esas tareas en habilidades?

00:17:01Y si tiene sentido, convertir esas habilidades en automatizaciones.

00:17:04Así es como construyes una arquitectura de habilidades como esta.

00:17:06Y aquí es donde reside todo el poder de esto.

00:17:08Por ejemplo, y lo que ves aquí es mucho de lo que hago en mis diferentes habilidades, algo como investigación de contenido.

00:17:14De nuevo, la mayoría de ustedes no están creando contenido, así que será algo completamente diferente.

00:17:17Pero, el punto sigue siendo el mismo.

00:17:19Entonces, ¿qué hago para investigar?

00:17:20Bueno, obviamente, necesito echar un vistazo a cosas como YouTube.

00:17:24Y así, convertí la búsqueda de información en YouTube en algo llamado mi habilidad de flujo de trabajo de YT, donde echa un vistazo a los videos de YouTube, los envía a Notebook LM, y luego me da resúmenes.

00:17:35Necesito poder realizar una investigación profunda sobre ciertos temas que vaya más allá de YouTube, que eche un vistazo a otras cosas, ya sea Twitter, internet en general, etcétera.

00:17:43Bueno, convertí eso en toda una habilidad de investigación profunda personalizada.

00:17:47Tengo todo un sistema GraphRag con LightRag, que tiene mucha información sobre lo que he hecho en el pasado.

00:17:52Entonces, ¿qué hice?

00:17:53Convertí todo ese sistema de consultas en una habilidad.

00:17:56Y así, una y otra y otra y otra vez.

00:17:58Luego repetí eso en todos los diferentes dominios de mi vida personal y empresarial, ya sea contenido, mi comunidad, mi agencia, ventas, etcétera, etcétera, etcétera.

00:18:07Y en términos prácticos, cómo harías eso es literalmente, simplemente abrirías Cloud Code, y le das una corriente de conciencia diciendo, esto es lo que hago todos los días.

00:18:15Y luego dirías, oye, ¿podemos convertir eso en habilidades?

00:18:17Y dentro de Chase Heia Plus y el enlace de abajo, tengo un script completo que puedes conectar a Cloud Code, y te guiará a través de eso si lo necesitas.

00:18:25Y para terminar de atar todo eso arriba, cuando hablamos de estas habilidades, si luego le dices a Jarvis, oye, haz la habilidad X, Y y Z, y pasa por el proceso de transcripción y el enrutamiento, la parte donde invocamos a Cloud Code en modo headless, ya sabes, y está ejecutando esto en segundo plano para hacer algo.

00:18:42Si lo que está haciendo es solo una habilidad simple, sabes que vas a obtener un resultado que es A, correcto, y B, consistente, porque ya has mapeado el proceso.

00:18:53No queda nada realmente al azar.

00:18:55Y cada vez que somos capaces de crear sistemas de IA que son más deterministas por naturaleza, mejor.

00:19:02Cuanto menos estemos sujetos solo a los problemas de la IA en general, como, bueno, tal vez hará lo que quiero, tal vez no, ¿verdad?

00:19:08Cuando creamos habilidades, hemos codificado ciertas cosas.

00:19:11Y así tomas todo eso, y tienes a Jarvis, ya sabes, y puedes ver bajo el capó, es mucho más que una interfaz de usuario elegante con algunas métricas que son agradables, que simplemente son buenas de tener.

00:19:22Hay mucho ocurriendo debajo de eso.

00:19:23Y de nuevo, el verdadero poder de algo como esto, porque es una aplicación web, es el hecho de que podemos empaquetarlo y compartirlo con miembros del equipo y compartirlo con clientes.

00:19:30Solo tienen que decirte, si eres tú quien lo está creando para ellos, lo que quieren en el lado de la personalización.

00:19:36Y el poder real, real, es toda la arquitectura de habilidades, y el hecho de que vas a guiarlos a través de la codificación de diferentes tareas.

00:19:46Porque entonces pueden sentarse aquí, o cualquiera podría sentarse en esta silla en la que estoy aquí mismo, y obtener como el 80, 90% del poder de Cloud Code de la manera en que lo uso todos los días, que son estas diferentes habilidades y automatizaciones.

00:19:56Está literalmente a un clic de distancia de ellos.

00:19:58Eso es lo que realmente les das.

00:20:00Y luego, si quieren algo más, ya sabes, tenemos toda la parte de voz de ello.

00:20:03Pero esto, al final, es una capa elegante encima de todo esto.

00:20:07Así que ese es todo el sistema en pocas palabras.

00:20:09Realmente me gusta, principalmente por la personalización del mismo, y el hecho de que podemos agregar muchas cosas locales.

00:20:14Así que puedes ser bastante creativo con lo que es capaz de hacer y a lo que es capaz de conectarse.

00:20:18De nuevo, nada te impide traer más fuentes externas de algo como esto, como convertirlo en un agente de Slack y ese tipo de cosas.

00:20:26Ahí es donde los voy a dejar con esto, chicos.

00:20:30Si quieren, de nuevo, mi configuración exacta dentro de Chase AM+, hay un enlace a eso en el comentario fijado.

00:20:36Pero por lo demás, déjenme saber qué pensaron, y los veré por ahí.

Key Takeaway

La creación de un SO agéntico como Jarvis permite automatizar flujos de trabajo complejos mediante la conversión de tareas manuales en habilidades modulares ejecutables con un solo clic.

Highlights

Jarvis opera como un sistema operativo agéntico personalizable que añade una capa visual e interactiva sobre Claude Code.
La arquitectura de Jarvis integra modelos locales como Faster Whisper para transcripción y Kokoro para síntesis de voz, reduciendo la dependencia de servicios en la nube.
El sistema utiliza expresiones regulares para automatizar tareas rápidas sin costo, reservando el uso de modelos como Haiku o Claude Code solo para tareas que requieren mayor capacidad lógica.
La integración con Obsidian permite vincular informes, datos de seguidores y tareas de Google Calendar directamente dentro del flujo de trabajo del usuario.
El modo headless (sin interfaz) de Claude Code permite ejecutar automatizaciones en segundo plano utilizando créditos API sin necesidad de interacción constante con la terminal.

Timeline

Arquitectura y propósito de Jarvis

Jarvis sirve como capa de control sobre Claude Code, facilitando métricas visuales y botones de acción rápida.
El sistema es personalizable y permite empaquetar flujos de trabajo para usuarios no técnicos.
La columna vertebral del sistema reside en la arquitectura de habilidades, convirtiendo tareas manuales en automatizaciones.

Jarvis funciona como un SO agéntico diseñado para operar en diversos dominios. A diferencia de trabajar directamente en la terminal, esta interfaz traduce tareas repetitivas en botones de acción. El sistema es agnóstico al modelo, permitiendo su ejecución local o mediante diversos modelos de lenguaje según la complejidad requerida.

Interfaz visual e integración de datos

Las funciones de voz son locales para asegurar rapidez y eliminar la latencia de servicios como 11Labs.
Los informes generados se almacenan y vinculan directamente en un Obsidian Vault personal.
El panel de la derecha permite ejecutar habilidades de Claude Code, ver el calendario y monitorear el estado del audio en tiempo real.

La interfaz muestra información dinámica basada en los datos del usuario. Al solicitar un informe, el sistema analiza documentos en Obsidian y genera ventanas emergentes con enlaces relevantes. Esta estructura permite a usuarios no técnicos ejecutar procesos complejos de automatización con un solo clic sin ver código.

Procesamiento y enrutamiento de peticiones

Las peticiones de voz pasan por Faster Whisper para transcripción local antes de cualquier procesamiento.
El enrutamiento utiliza expresiones regulares (regex) para tareas inmediatas y el modelo Haiku para decisiones que requieren mayor lógica.
El sistema invoca una versión headless de Claude Code cuando se requiere generar contenido nuevo fuera de los informes existentes.

Cuando el usuario realiza una petición, el sistema sigue una ruta lógica definida. Primero, utiliza regex para identificar palabras clave como “resumen” y ejecutar acciones instantáneas sin costo de IA. Si la tarea es más compleja, Haiku determina la ruta necesaria, y si el recurso no existe, Claude Code se activa en segundo plano para crearlo.

Arquitectura de habilidades y escalabilidad

Las habilidades se construyen desglosando flujos de trabajo diarios en tareas individuales y deterministas.
El sistema permite integrar fuentes externas como YouTube o sistemas de investigación como GraphRag.
El valor principal reside en la capacidad de compartir este sistema empaquetado con equipos o clientes no técnicos.

La eficacia del sistema depende de la capacidad de desglosar tareas diarias en habilidades granulares. Al hacer el proceso más determinista, se reduce la incertidumbre asociada a las respuestas de la IA. Jarvis permite que cualquier persona acceda al 80-90% de la capacidad de Claude Code mediante una interfaz simplificada.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video