Creando un motor de trabajo automático conectando Obsidian Markdown con Claude Code

Limpiar primero los datos basura traídos por el Web Clipper

Los archivos Markdown extraídos de la web son un cúmulo de ruido, como anuncios y barras de menú. Si este tipo de texto se mezcla, el rendimiento de RAG (Generación Aumentada por Recuperación) disminuye notablemente. En realidad, los datos no depurados distraen la atención del modelo, mientras que un Markdown bien organizado mejora la precisión de la búsqueda. Al eliminar el texto innecesario, los tokens consumidos por el LLM local se reducen en más de un 30%, por lo que no desperdiciará dinero.

Debe eliminar este ruido utilizando la librería BeautifulSoup de Python.

En la terminal, configure el entorno escribiendo pip install beautifulsoup4 lxml.
En el script, elimine clases CSS innecesarias como .ad-container o .nav-menu por completo con el método decompose().
Extraiga solo el cuerpo del texto con el analizador lxml, guárdelo como Markdown e insértelo en su bóveda de Obsidian.
De esta manera, el modelo se centrará solo en el contenido principal, cometerá menos alucinaciones y el consumo de tokens caerá drásticamente hasta un nivel del 25%.

Diseño de carpetas para que Claude Code no se pierda

Cuando los archivos aumentan a cientos, incluso el modelo más inteligente pierde el contexto. No se limite a apilar archivos; divida las áreas según el estado de la información. Yo utilizo una estructura de 3 etapas (01_Raw_Inbox, 02_Processed_Wiki, 03_Project_Action) adaptando el framework PARA. Se trata de dar una guía física a Claude Code sobre qué información debe confiar y consultar.

Aproveche los nombres de los archivos y las opciones de la terminal para que el agente no se pierda.

Añada YYYY-MM-DD al principio de todos los nombres de archivos para indicarle qué tan fresca es la información.
Al ejecutar Claude Code, use la opción --newer-than para que lea solo los archivos modificados en las últimas 24 horas.
En la carpeta 03_Project_Action, coloque solo los archivos que contengan el estado de las tareas.
Con esta estructura, Claude no cometerá la estupidez de hurgar en toda la bóveda. Gracias a esto, una búsqueda que tardaba 10 minutos se completa en solo 30 segundos.

Llenar los huecos de búsqueda con metadatos YAML

Una simple búsqueda de texto no puede distinguir si este documento es "importante" o si es una "tarea terminada". Por eso, debe insertar YAML Frontmatter en la parte superior del documento. Con los metadatos, puede dar instrucciones mucho más precisas a Claude Code.

Tres campos son suficientes para el motor de trabajo de un emprendedor del conocimiento.

Escriba topic para dividir temas, source_importance para ponderar la importancia y status para el estado de la tarea en la parte superior de la nota.
Aplique esta regla a cientos de archivos existentes a la vez con el plugin "YAML Toolkit" de Obsidian.
En el archivo de configuración de Claude Code (CLAUDE.md), escriba: "Crea la lista de tareas consultando solo los documentos cuyo status sea Doing".
Se liberará de la penosa tarea de organizar datos durante 2 horas cada mañana y estará en condiciones de recibir un informe de trabajo en solo 10 minutos.

Rutina de briefing diario que termina con una sola línea de comando

Claude Code basado en terminal muestra su verdadero poder cuando se encuentra con scripts de shell. Al llegar al trabajo, con solo ejecutar un comando, se completa un motor que analiza lo estudiado ayer y extrae hasta el borrador del correo que enviará hoy. No hay necesidad de desperdiciar energía pensando qué hacer primero cada mañana.

La rutina de automatización se construye de la siguiente manera:

Cree un script de shell (.sh o .bat) con el comando claude --bare para aumentar la velocidad de arranque inicial.
Mezcle el comando find -mtime -1 en el script para pasarle a Claude solo las notas creadas en el último día.
Use la función PostToolUse de Claude Code para corregir errores tipográficos en el borrador del correo generado y hacer que se guarde automáticamente en una carpeta específica.
El tiempo dedicado a escribir un correo se reduce de 30 minutos a solo 5 minutos.

Estrategia de referencia jerárquica para enfrentar la explosión de datos

Cuando los archivos superan los mil, la ventana de contexto de 200,000 tokens se llena rápidamente. A partir de este punto, no debe hacer que lea todos los archivos, sino utilizar un método de dos etapas donde primero consulte master_index.md, que actúa como un mapa general. Este método reduce el número de llamadas a la API en casi un 60%.

Para mantener el rendimiento, la gestión del contexto debe ser inteligente.

Entienda y gestione el consumo total de tokens con la siguiente configuración: $T_{total} = T_{system} + T_{index} + T_{active\_files} + T_{history}$
Haga que Claude Code lea primero el índice maestro y busque solo las rutas de archivos estrictamente necesarias para responder a la pregunta.
Lea adicionalmente solo los archivos de las rutas encontradas para elaborar la respuesta y, si la conversación se alarga, resuma el historial con el comando /compact.
Al adoptar esta estructura jerárquica, podrá recibir apoyo inmediato para la toma de decisiones sin ralentizaciones, sin importar cuántos datos se acumulen.

Creando un motor de trabajo automático conectando Obsidian Markdown con Claude Code

Limpiar primero los datos basura traídos por el Web Clipper

Debe eliminar este ruido utilizando la librería BeautifulSoup de Python.

En la terminal, configure el entorno escribiendo pip install beautifulsoup4 lxml.
En el script, elimine clases CSS innecesarias como .ad-container o .nav-menu por completo con el método decompose().
Extraiga solo el cuerpo del texto con el analizador lxml, guárdelo como Markdown e insértelo en su bóveda de Obsidian.
De esta manera, el modelo se centrará solo en el contenido principal, cometerá menos alucinaciones y el consumo de tokens caerá drásticamente hasta un nivel del 25%.

Diseño de carpetas para que Claude Code no se pierda

Aproveche los nombres de los archivos y las opciones de la terminal para que el agente no se pierda.

Añada YYYY-MM-DD al principio de todos los nombres de archivos para indicarle qué tan fresca es la información.
Al ejecutar Claude Code, use la opción --newer-than para que lea solo los archivos modificados en las últimas 24 horas.
En la carpeta 03_Project_Action, coloque solo los archivos que contengan el estado de las tareas.
Con esta estructura, Claude no cometerá la estupidez de hurgar en toda la bóveda. Gracias a esto, una búsqueda que tardaba 10 minutos se completa en solo 30 segundos.

Llenar los huecos de búsqueda con metadatos YAML

Tres campos son suficientes para el motor de trabajo de un emprendedor del conocimiento.

Escriba topic para dividir temas, source_importance para ponderar la importancia y status para el estado de la tarea en la parte superior de la nota.
Aplique esta regla a cientos de archivos existentes a la vez con el plugin "YAML Toolkit" de Obsidian.
En el archivo de configuración de Claude Code (CLAUDE.md), escriba: "Crea la lista de tareas consultando solo los documentos cuyo status sea Doing".
Se liberará de la penosa tarea de organizar datos durante 2 horas cada mañana y estará en condiciones de recibir un informe de trabajo en solo 10 minutos.

Rutina de briefing diario que termina con una sola línea de comando

La rutina de automatización se construye de la siguiente manera:

Cree un script de shell (.sh o .bat) con el comando claude --bare para aumentar la velocidad de arranque inicial.
Mezcle el comando find -mtime -1 en el script para pasarle a Claude solo las notas creadas en el último día.
Use la función PostToolUse de Claude Code para corregir errores tipográficos en el borrador del correo generado y hacer que se guarde automáticamente en una carpeta específica.
El tiempo dedicado a escribir un correo se reduce de 30 minutos a solo 5 minutos.

Estrategia de referencia jerárquica para enfrentar la explosión de datos

Para mantener el rendimiento, la gestión del contexto debe ser inteligente.

Entienda y gestione el consumo total de tokens con la siguiente configuración: $T_{total} = T_{system} + T_{index} + T_{active\_files} + T_{history}$
Haga que Claude Code lea primero el índice maestro y busque solo las rutas de archivos estrictamente necesarias para responder a la pregunta.
Lea adicionalmente solo los archivos de las rutas encontradas para elaborar la respuesta y, si la conversación se alarga, resuma el historial con el comando /compact.
Al adoptar esta estructura jerárquica, podrá recibir apoyo inmediato para la toma de decisiones sin ralentizaciones, sin importar cuántos datos se acumulen.

Creando un motor de trabajo automático conectando Obsidian Markdown con Claude Code

Related Video

Obsidian RAG de Karpathy + Claude Code = TRUCO MAESTRO

Creando un motor de trabajo automático conectando Obsidian Markdown con Claude Code

Limpiar primero los datos basura traídos por el Web Clipper

Diseño de carpetas para que Claude Code no se pierda

Llenar los huecos de búsqueda con metadatos YAML

Rutina de briefing diario que termina con una sola línea de comando

Estrategia de referencia jerárquica para enfrentar la explosión de datos

Comments (0)

Creando un motor de trabajo automático conectando Obsidian Markdown con Claude Code

Limpiar primero los datos basura traídos por el Web Clipper

Diseño de carpetas para que Claude Code no se pierda

Llenar los huecos de búsqueda con metadatos YAML

Rutina de briefing diario que termina con una sola línea de comando

Estrategia de referencia jerárquica para enfrentar la explosión de datos