00:00:00(música animada) - Hola, muchas gracias por recibirnos.
00:00:11Soy Jack,
00:00:11y junto con mi colega Nikita,
00:00:13que llegará en un momento,
00:00:15construimos Lightfield,
00:00:17un CRM nativo de IA.
00:00:19Empezamos a usar AI SDK V4 a principios de enero,
00:00:22y adoptamos V5 tan pronto como salió en alfa en junio.
00:00:26Hoy queremos compartir cómo construimos un sistema en producción donde los agentes de IA tienen acceso seguro de lectura-escritura a los datos de clientes,
00:00:34cómo manejamos flujos de trabajo con intervención humana,
00:00:37y las decisiones arquitectónicas que hicieron todo posible.
00:00:40Vamos a recorrer los patrones que descubrimos,
00:00:43los compromisos que hicimos,
00:00:45y cómo el AI SDK nos permitió avanzar rápido sin atraparnos en una esquina.
00:00:49Pero primero,
00:00:50hablemos de por qué los CRM estaban rotos,
00:00:53y por qué esto importa.
00:00:54¿Quién está familiarizado con los CRM?
00:00:59¿Tal vez?
00:01:00¿Algunos ingenieros?
00:01:01Bien,
00:01:01aquí está lo que se suponía que debería suceder,
00:01:03¿verdad?
00:01:03Empiezas a hablar con clientes.
00:01:05Tal vez eres un fundador haciendo ventas.
00:01:07O estás en el equipo de ventas.
00:01:10Al principio, parece manejable.
00:01:11Te acuerdas de todos.
00:01:13Cada conversación está fresca en tu mente.
00:01:16Luego,
00:01:16llegas a 10 clientes,
00:01:1820,
00:01:1850,
00:01:19y alguien en tu equipo de ventas pregunta: "Oye,
00:01:22¿qué dijo Sarah de Acme sobre nuestros precios?
00:01:26¿Tenía dudas sobre el plan empresarial?
00:01:28"Así que ahora estás buscando en Slack."
00:01:31Buscas en tu correo electrónico.
00:01:32Buscas en Google Docs.
00:01:34Tal vez ese video de Zoom que aún no ha sido transcrito.
00:01:38Finalmente lo encuentras enterrado en un hilo de hace dos semanas,
00:01:41pero te das cuenta de que nunca actualizaste tu hoja de cálculo de nuevo.
00:01:44Así que compras un CRM.
00:01:47Promete ser tu única fuente de verdad,
00:01:49pero se convierte en otro lugar que olvidas actualizar.
00:01:52Aquí está el problema.
00:01:54Los CRM tradicionales fueron construidos hace décadas con la suposición fundamental de que los humanos harían entrada de datos manual.
00:02:01Te dieron estos campos rígidos y esquemas predefinidos,
00:02:05pero el contexto real,
00:02:06la sutileza de tu conversación,
00:02:08vive en tu correo,
00:02:10Slack,
00:02:10notas de reuniones,
00:02:11en diferentes lugares.
00:02:13Y el CRM se convierte simplemente en una herramienta de reportes para tu VP de ventas,
00:02:18no en algo que te ayude a vender.
00:02:20Así que pensamos que debe haber una mejor manera.
00:02:22¿Y si el sistema pudiera simplemente recordar?
00:02:25¿Y si capturara todo inteligentemente y pudiera realmente actuar en tu nombre?
00:02:30Ese es Lightfield.
00:02:31Así que Lightfield reimagina lo que debería ser un CRM.
00:02:35Es un sistema de memoria y acción para startups.
00:02:39Tiene captura automática.
00:02:41Las conversaciones,
00:02:43reuniones,
00:02:44correos,
00:02:44se capturan todos y se estructuran sin entrada manual.
00:02:50Tiene memoria sin pérdida.
00:02:52Soportamos esquemas de lista y esquemas personalizables.
00:02:54No necesitas saber qué rastrear desde el principio o pagar a un consultor para configurarlo por ti.
00:02:58Y convierte la memoria en acción.
00:03:02Lightfield usa todo ese contexto capturado,
00:03:04tanto datos estructurados como conversacionales,
00:03:07para redactar seguimientos,
00:03:08mostrar información y automatizar flujos de trabajo para ti.
00:03:11Ahora,
00:03:12los CRM tradicionales se construyen para que los equipos de ventas traceen acuerdos de ventas,
00:03:17pero como Lightfield captura y estructura todos estos datos conversacionales,
00:03:21se vuelve realmente poderoso para cualquiera que necesite recordar y actuar sobre el contexto del cliente.
00:03:26¿Cuáles fueron las características más solicitadas en las incorporaciones de la semana pasada?
00:03:31Los equipos de éxito del cliente entendiendo patrones en conversaciones de soporte.
00:03:35El mismo sistema,
00:03:36preguntas diferentes,
00:03:37pero todo potenciado por esa misma capa de memoria.
00:03:40Ese es el producto.
00:03:41Déjame mostrarte cómo se ve realmente.
00:03:43Aquí hay un ejemplo de preguntar al agente Lightfield.
00:03:48Creo que estamos pidiendo encontrar cinco oportunidades estancadas y redactar un correo personalizado para cada una.
00:03:55Puede buscar en toda tu información de clientes usando un agente construido con AI SDK.
00:04:02Puede entender qué son las oportunidades estancadas,
00:04:05y luego puede usar esa información para redactar correos personalizables para todas las personas de esas oportunidades.
00:04:23Aquí hay un ejemplo.
00:04:25Y luego,
00:04:25sabes,
00:04:26un usuario puede,
00:04:27podemos ahora enviar ese correo mejor para ti.
00:04:29Entonces, ¿cómo funciona todo esto?
00:04:34Vamos a recorrer lo que está sucediendo bajo el capó.
00:04:37Un usuario toma una acción.
00:04:39Esto podría ser enviar un mensaje de chat.
00:04:41Esto podría ser un evento externo,
00:04:43como un disparador,
00:04:44como un correo o terminar una reunión.
00:04:47El agente obtiene contexto inmediatamente.
00:04:50¿Dónde está el usuario en la aplicación?
00:04:52¿Qué han estado haciendo recientemente?
00:04:54¿Y cuál es su intención?
00:04:55¿Qué herramientas están disponibles para ellos?
00:04:57Luego Lightfield se activa.
00:04:59Busca datos relevantes,
00:05:01toma acción en el CRM y actualiza registros y respuestas.
00:05:05Todo esto sucede a través de la misma capa de datos unificada que potencia la interfaz de usuario.
00:05:10Déjame mostrarte cómo hacemos esto.
00:05:11Aquí está la arquitectura que hace que todo esto funcione.
00:05:15Tres interfaces diferentes aquí.
00:05:19Interfaz de usuario para humanos,
00:05:21agentes para lenguaje natural,
00:05:23y trabajos de flujo de trabajo para automatización.
00:05:26Aquí está la clave.
00:05:27Todos interactúan a través de la misma capa unificada,
00:05:31objetos de dominio.
00:05:32Entonces, tienen los mismos permisos.
00:05:33El agente tiene los mismos permisos que el usuario que ejecuta el agente.
00:05:37Misma lógica de negocios y los mismos patrones de acceso a datos.
00:05:41No hay una API de agente separada con reglas diferentes o acceso limitado.
00:05:46Así que unimos almacenamiento de una variedad de sistemas aquí.
00:05:51Datos estructurados,
00:05:52almacenamiento de objetos,
00:05:54e indexados en varias plataformas de búsqueda.
00:05:57Así que proporcionamos las mismas capacidades y la misma interfaz.
00:06:01Un principio que usamos para construir nuestra plataforma es paridad de interfaz de agente-usuario.
00:06:10Si un usuario puede acceder a algo,
00:06:12un agente puede acceder a ello.
00:06:14Capacidades completas de lectura,
00:06:16creación y actualización en todos los datos.
00:06:19Así que,
00:06:19los mismos permisos,
00:06:20la misma visibilidad,
00:06:22las mismas operaciones.
00:06:24Bueno,
00:06:24es una decisión de producto y arquitectura que hicimos desde el primer día.
00:06:28Es por eso que construir nativo de IA desde el principio vence a incorporar agentes en sistemas heredados.
00:06:34Entonces,
00:06:35los agentes en Lightfield actúan en tu nombre con los mismos permisos a través de la misma capa de datos que potencia la interfaz de usuario.
00:06:42Son simplemente otra interfaz para tus datos.
00:06:44Entonces,
00:06:45cuando estamos eligiendo herramientas para construir Lightfield,
00:06:48necesitábamos primitivas que no nos forzaran a diferentes arquitecturas para agentes versus usuarios.
00:06:54Esa restricción influyó en toda nuestra pila,
00:06:56incluyendo el marco de IA que elegimos.
00:06:58Y para nosotros,
00:07:00lo que importa en la construcción de productos de IA en 2025 es que nadie tiene el manual completo,
00:07:09¿verdad?
00:07:10Así que estamos tratando de optimizar la velocidad de aprendizaje sobre la perfección.
00:07:14Así que en realidad practicamos este concepto con Lightfield.
00:07:19Cuando nuestros equipos de ingeniería necesitan entender un problema del cliente,
00:07:23no tienen que navegar por el CRM.
00:07:25Simplemente pueden preguntarlo.
00:07:26Así que el lenguaje natural es realmente la interfaz que queremos allí.
00:07:35Así que,
00:07:36AISDK nos dio la flexibilidad para iterar en esto sin reescribir todo.
00:07:41Pero la clave fue la mentalidad.
00:07:43Nos enfocamos en construir características y resolver problemas reales,
00:07:47no en luchar contra marcos de trabajo u sobreingeniería abstracciones.
00:07:50Así que,
00:07:51la clave aquí es avanzar rápido y aprender rápidamente.
00:07:53Así que, seguimos volviendo a esta cita.
00:08:02"La duplicación es mucho más barata que la abstracción equivocada"
00:08:07de Sandy Metz.
00:08:08Y creo que esto es bastante prevalente en la construcción de productos de IA hoy.
00:08:13Es muy rápido construir software rápidamente ahora.
00:08:17Es incluso más rápido que hace un año.
00:08:19Y asegurarse de que el marco correcto exista es realmente importante.
00:08:23Y tener la abstracción equivocada puede ser incluso más costoso.
00:08:27Así que, hablemos sobre esto más en la práctica.
00:08:34Así que,
00:08:35mientras construimos Lightfield,
00:08:38empezamos a desarrollar AISDK en enero de este año.
00:08:43Así que lo adoptamos para soportar cambio de modelos y comenzamos a usar los primitivos de tipo de flujo de texto.
00:08:54Y así,
00:08:54pudimos lanzar tareas tempranas a agentes específicos en semanas.
00:08:58Así que comenzamos a construir más y más agentes en más y más características de chat.
00:09:04Y en junio de 2025,
00:09:05comenzamos a adoptar la API useChat,
00:09:09específicamente por las opciones de transporte personalizado que se lanzaron.
00:09:16Lo principal aquí es que hemos podido adoptar AISDK,
00:09:22pasar de V4 a alfa V5.
00:09:25Así que,
00:09:26creo que suena como que V6 será lanzado pronto,
00:09:30bastante sin problemas con el avance rápido.
00:09:34Tenemos una especie de broma interna de que identificaremos una característica que necesitamos de AISDK y al día siguiente veremos un tweet del equipo de AISDK.
00:09:46Y aprendiendo esta mañana,
00:09:48supongo,
00:09:48que Nico tiene un agente que solo genera esos tweets.
00:09:51Así que es bastante divertido ver eso.
00:09:53Así que,
00:09:54eso es exactamente lo que quieres de un marco de trabajo.
00:09:57Crece contigo en lugar de forzarte a reescribir o desacelerar.
00:10:00Aquí hay un ejemplo de Lightfield en acción aquí.
00:10:05Así que,
00:10:06en el chat aquí,
00:10:08estoy preguntando,
00:10:09estoy escribiendo una pregunta,
00:10:12¿qué sigue para esta cuenta?
00:10:16¿Qué mencionó Jordan Lee en nuestra última llamada?
00:10:19Así que, nota lo que el usuario no tuvo que hacer.
00:10:21No tuvieron que decir que la cuenta es protocolo simplificado o preguntar específicamente sobre cierta reunión.
00:10:30Así que usamos AISDK para construir esta característica que tenemos llamada Construcción de Contexto Adaptativo.
00:10:37Así que proporciona señales del usuario combinadas con recuperación inteligente para descubrir qué realmente importa para eso.
00:10:45Así que,
00:10:45déjame compartir algunos ejemplos de cómo usamos el SDK para hacer esto.
00:10:49Entonces,
00:10:49el SDK tiene una API llamada Data Parts y la usamos para proporcionar señales del cliente al servidor que está construyendo el contexto.
00:11:01Podemos,
00:11:02en el cliente,
00:11:03usar diferentes entidades y proporcionar diferentes señales usando la API de Data Parts y luego hidratamos esto completamente en el servidor.
00:11:11Voy a dejar que mi colega Nikita hable más sobre cómo usamos Data Parts para construir más características aquí.
00:11:19(música animada)
00:11:24(música animada) - Muchas gracias, Jack.
00:11:28Entonces,
00:11:29otro ejemplo similar a la Construcción de Contexto Adaptativo es cómo inyectamos archivos en el hilo de chat.
00:11:35AISDK nos proporciona una forma realmente fácil de hacer esto.
00:11:39Simplemente podemos usar la función de enviar mensaje del gancho useChat,
00:11:44proporcionarle la consulta del usuario y la lista de archivos y funcionará con cualquier proveedor directamente.
00:11:50Pero esto plantea algunas preocupaciones prácticas en torno a la escalabilidad.
00:11:54Por ejemplo,
00:11:55¿cómo nos aseguramos de evitar persistir esos datos directamente en la base de datos si estamos codificando directamente los archivos?
00:12:01Si estamos usando URLs de S3,
00:12:03¿cómo nos aseguramos de no exponer accidentalmente esos datos de usuario privados al público?
00:12:09Nuestra solución para esto es hacer que el cliente envíe al backend un ID interno que haga referencia al archivo cargado dentro de nuestro propio almacén de datos.
00:12:21En el backend,
00:12:22iteraremos a través de todas las partes del archivo y reemplazaremos esos identificadores internos con URLs de S3 firmadas.
00:12:30Esto permite que los proveedores de LM externos sigan viendo esos archivos adjuntos,
00:12:35pero el tiempo de vencimiento en las URLs firmadas previene el acceso no autorizado.
00:12:41Otro ejemplo de cómo protegemos los datos del usuario en Lightfield es a través de este concepto de colecciones de herramientas contextuales.
00:12:50Siempre que un usuario interactúa con el producto de chat de Lightfield,
00:12:55construiremos dinámicamente un conjunto de herramientas específico para el usuario.
00:13:00Inyectaremos esas dependencias directamente en las herramientas.
00:13:03Por ejemplo,
00:13:04en esta herramienta de recuperación de datos,
00:13:07inyectamos los IDs del usuario directamente en la herramienta misma.
00:13:11El LLM nunca emite consultas directamente a la base de datos.
00:13:15Siempre va a través de la misma capa de datos unificada que el usuario accedería a través del resto de la interfaz del CRM.
00:13:23Así que tenemos esta filosofía de diseño de mantener paridad entre la interfaz de usuario del CRM y las capacidades del agente.
00:13:34Cuando el usuario puede crear entidades de CRM como cuentas,
00:13:38oportunidades y contactos a través de esta interfaz modal en la interfaz de usuario,
00:13:42queremos que puedan hacer lo mismo a través de la interfaz basada en chat.
00:13:48El LLM puede emitir una llamada de herramienta para crear estas cuentas y renderizará un formulario con las mismas entradas que se muestran dentro de la interfaz de usuario.
00:13:57Construimos esto aprovechando las abstracciones de bucle humano del SDK de IA.
00:14:03La forma en que funciona básicamente es que cuando el LLM emite una llamada de herramienta que requiere confirmación,
00:14:11la reenvía al cliente del front-end.
00:14:13El cliente renderizará una interfaz y añadirá un resultado de herramienta dependiendo de la acción del usuario.
00:14:20En el back-end,
00:14:21justo antes de que enviemos ese resultado al LLM,
00:14:25ejecutaremos las funciones dependiendo de lo que el usuario envió.
00:14:31Un esquema que describe cómo hicimos esto se muestra aquí.
00:14:37Así que la entrada inicial del usuario es esta llamada de herramienta.
00:14:43El LLM sugiere un conjunto de valores de entrada,
00:14:46en este caso un arreglo de elementos que representan los nombres de cuenta y sus dominios.
00:14:51Después de que el usuario edita los valores,
00:14:53la salida se convierte en los valores editados del usuario junto con un campo adicional que indica si aprobaron ese elemento en particular.
00:15:03Después de que la función se ejecuta,
00:15:05añadimos ese resultado a la salida de la herramienta antes de que se envíe al LLM.
00:15:11Por ejemplo,
00:15:12¿fue la creación de cuenta exitosa o falló por alguna razón,
00:15:16como tal vez la cuenta ya existe en el CRM?
00:15:19Esto proporciona al LLM visibilidad completa en el historial de la interacción.
00:15:26Puede ver todo el flujo,
00:15:28los valores sugeridos originalmente y los resultados.
00:15:33Esto le proporciona la capacidad de sugerir apropiadamente los siguientes pasos.
00:15:38Así que también tenemos este principio de diseño de permitir al usuario moldeador el CRM para que se adapte a sus necesidades.
00:15:45Cada negocio tiene aspectos únicos sobre sí mismos y procesos de ventas únicos.
00:15:52Queremos que puedas personalizar el CRM y personalizar tu experiencia con el agente para que se adapte a tus necesidades específicas.
00:16:00Dentro de Lightfield,
00:16:01puedes construir un modelo de datos personalizado para cada una de las entidades del CRM.
00:16:08Por ejemplo,
00:16:09si eres una herramienta de productividad B2B tratando de vender tu herramienta de codificación a startups,
00:16:15podrías estar particularmente interesado en rastrear la pila de tecnología de tu cliente,
00:16:20el tamaño del equipo de ingeniería,
00:16:22y tal vez cualquier inversor mutuo que tengas con ellos.
00:16:26Dentro de Lightfield,
00:16:27puedes especificar todos estos campos tipados.
00:16:30Y puedes especificar cómo el agente debe usar estos campos en sus procesos.
00:16:38Puedes proporcionar instrucciones adicionales sobre los significados de estos campos y cómo debe usarlos cuando los actualiza en los diversos flujos de trabajo de fondo.
00:16:48Por ejemplo,
00:16:49si creaste un campo,
00:16:50puedes pedirle al agente que lo rellene haciendo investigación profunda en la web y enriqueciendo estos campos para todas las cuentas en tu sistema.
00:17:03O puedes pedirle que lo rellene buscando en tus registros del CRM,
00:17:06que incluyen tus transcripciones de reuniones,
00:17:09correos electrónicos y otras interacciones con la cuenta.
00:17:13La forma en que se ve esto en el back-end es que creamos esta herramienta en tiempo de ejecución,
00:17:21que con un esquema basado en la configuración particular de tu empresa.
00:17:28El esquema de la herramienta real se deriva de esa base de datos.
00:17:32Y cuando el LLM sugiere valores,
00:17:34validaremos los tipos para asegurar que coincidan con ese esquema.
00:17:38Esto nos permite construir estas herramientas realmente flexibles y altamente confiables.
00:17:42Dentro de Lightfield,
00:17:44también puedes configurar esta sección de conocimiento donde puedes proporcionar al LLM contexto adicional sobre tu negocio.
00:17:53Puedes proporcionar información sobre los productos de tu empresa e indicaciones sobre cómo el LLM debe ejecutar flujos de trabajo de fondo,
00:18:04como la preparación de reuniones.
00:18:06Antes de cada reunión,
00:18:08Lightfield preparará un documento para ti,
00:18:12preparándote para la discusión.
00:18:15Listará a los asistentes clave e información adicional sobre ellos.
00:18:19Listará información sobre la cuenta particular con la que te estás reuniendo,
00:18:24así como otros puntos de discusión clave importante.
00:18:27Después de la reunión,
00:18:29sugerirá elementos de acción de seguimiento y actualizaciones de campos sugeridas basadas en lo que discutiste.
00:18:35Todos estos bloques de construcción básicos se combinan para desbloquear nuevas capacidades poderosas.
00:18:42Porque Lightfield tiene el contexto completo de todas tus interacciones de ventas y tiene un alto grado de conocimiento personalizado,
00:18:50puede colaborar contigo para generar rápidamente correos electrónicos de alta calidad en tu nombre.
00:18:56Por ejemplo,
00:18:57después de una reunión,
00:18:58puedes usar esta herramienta para acceder a tu Calendario de Google para ver tu disponibilidad.
00:19:05Cuando se genera este artefacto de correo borrador,
00:19:08puede sugerir apropiadamente tiempos de seguimiento basados en tus discusiones anteriores.
00:19:14Estos correos redactados siguen siendo protegidos detrás de la aprobación del usuario,
00:19:19así que puedes estar seguro de que el agente LLM nunca tomará acción sin tu aprobación explícita.
00:19:25Estos elementos de acción de seguimiento y borradores de correo se preparan para ti,
00:19:30y te enviaremos notificaciones para,
00:19:32para ayudar a garantizar que te mantengas al tanto de cada acuerdo en el que estás trabajando.
00:19:37Bien, de vuelta a ti, Jack, para unir todo esto.
00:19:43- Sí.
00:19:46(audiencia aplaudiendo) Gracias, Nikita.
00:19:53Entonces,
00:19:54los principios centrales que descubrimos mientras construimos Lightfield con AI SDK.
00:19:59Principio uno,
00:20:00paridad de interfaz de usuario seguro del agente.
00:20:03Diseñado para esto desde el primer día.
00:20:05Los agentes necesitan acceso de lectura-escritura completo a través de la misma capa de datos que usan los humanos.
00:20:09No construyas una API de agente separada.
00:20:11Terminarás manteniendo múltiples sistemas,
00:20:13y ninguno se sentirá completo.
00:20:15Principio dos, iteración rápida sobre abstracción perfecta.
00:20:19Optimiza la velocidad de aprendizaje temprano,
00:20:21no la perfección por adelantado.
00:20:23Teníamos código que se veía similar en agentes de chat,
00:20:25características de API y flujos de trabajo de fondo.
00:20:28Alguna duplicación es genuinamente más barata que la abstracción equivocada,
00:20:32especialmente cuando se están formando convenciones.
00:20:35Principio tres,
00:20:36flujos de trabajo de bucle humano que los usuarios confían.
00:20:41Las personas necesitan mantenerse en control,
00:20:43especialmente para interacciones de alto riesgo.
00:20:45Interceptamos la capa de herramientas.
00:20:48El agente ve la sugerencia original,
00:20:50las ediciones del usuario y el resultado de ejecución.
00:20:53Transparencia completa, historial completo.
00:20:56Eso es lo que gana confianza.
00:20:58Principio cuatro,
00:20:59sistemas programables por usuarios y agentes.
00:21:02Los clientes reales necesitan modelos de datos personalizados.
00:21:04Cada negocio rastrea las cosas de forma diferente.
00:21:07Tanto los usuarios como los agentes pueden definir nuevos campos,
00:21:10y el sistema puede adaptarse a ello.
00:21:13Esto significa que tu producto se amolda a cómo los clientes estructuran sus datos,
00:21:17no al revés.
00:21:18Es más complejo de construir,
00:21:19pero es la diferencia entre un producto que la gente tolera y uno sin el que no pueden vivir.
00:21:24Así que nos encantaría escuchar qué estás construyendo y qué patrones estás descubriendo.
00:21:28Ven a encontrarnos después o visítanos en lightfield.app para ver estos principios en acción.
00:21:34Gracias.
00:21:35(música animada)