Criando um motor de automação de tarefas conectando Markdown do Obsidian ao Claude Code

Limpando os dados inúteis trazidos pelo Web Clipper

Arquivos Markdown capturados da web são aglomerados de ruído, como anúncios e barras de menu. Quando esse tipo de texto está misturado, o desempenho do RAG (Geração Aumentada de Recuperação) cai visivelmente. Na realidade, dados não refinados dispersam a atenção do modelo, enquanto um Markdown limpo e organizado aumenta a precisão da busca. Ao eliminar textos desnecessários, os tokens consumidos pelo LLM local diminuem em mais de 30%, evitando desperdício de dinheiro.

É necessário usar a biblioteca BeautifulSoup do Python para remover esse ruído.

No terminal, configure o ambiente digitando pip install beautifulsoup4 lxml.
No script, use o método decompose() para apagar classes CSS desnecessárias inteiras, como .ad-container ou .nav-menu.
Extraia apenas o corpo do texto com o parser lxml, salve em Markdown e coloque no cofre (vault) do Obsidian.
Dessa forma, o modelo foca apenas no conteúdo principal, reduzindo alucinações e derrubando o consumo de tokens para o nível de 25%.

Design de pastas para que o Claude Code não se perca

Quando os arquivos aumentam para centenas, até o modelo mais inteligente perde o contexto. Não apenas acumule arquivos; divida as áreas de acordo com o status da informação. Eu utilizo uma estrutura de 3 etapas (01_Raw_Inbox, 02_Processed_Wiki, 03_Project_Action), adaptando o framework PARA. Isso fornece diretrizes físicas sobre quais informações o Claude Code deve confiar e consultar.

Utilize nomes de arquivos e opções de terminal para que o agente não fique perdido.

Adicione YYYY-MM-DD na frente de todos os nomes de arquivos para indicar quão fresca é a informação.
Ao executar o Claude Code, use a opção --newer-than para fazê-lo ler apenas arquivos alterados nas últimas 24 horas.
Na pasta 03_Project_Action, mantenha apenas arquivos com o status da tarefa anotado.
Com essa estrutura, o Claude evita a tolice de revirar todo o cofre. Graças a isso, buscas que levavam 10 minutos terminam em 30 segundos.

Preenchendo lacunas na busca com metadados YAML

Uma simples busca de texto não consegue distinguir se um documento é "importante" ou se é uma "tarefa concluída". Por isso, é necessário inserir um YAML Frontmatter no topo do documento. Com metadados, você pode dar comandos muito mais sofisticados ao Claude Code.

Para o motor de trabalho de um empreendedor de conhecimento, três campos são suficientes:

Escreva topic para dividir o tema, source_importance para avaliar a importância e status para o estado da tarefa no topo da nota.
Use o plugin "YAML Toolkit" do Obsidian para aplicar essa regra a centenas de arquivos existentes de uma só vez.
No arquivo de configuração do Claude Code (CLAUDE.md), escreva: "Crie a lista de tarefas olhando apenas documentos cujo status seja Doing".
Aquele sofrimento de organizar materiais por 2 horas toda manhã se transforma em um estado onde você recebe o briefing de trabalho em apenas 10 minutos.

Rotina de briefing diário finalizada com uma linha de comando

O Claude Code baseado em terminal mostra seu verdadeiro poder quando encontra scripts shell. Ao chegar no trabalho, basta digitar um comando para que o motor analise o que foi estudado ontem e até extraia o rascunho do e-mail a ser enviado hoje. Não há necessidade de gastar energia pensando no que fazer primeiro a cada manhã.

A rotina de automação é montada da seguinte forma:

Crie um script shell (.sh ou .bat) contendo o comando claude --bare para aumentar a velocidade de inicialização.
Misture o comando find -mtime -1 no script para passar ao Claude apenas as notas criadas no último dia.
Use a função PostToolUse do Claude Code para corrigir erros de digitação no rascunho de e-mail gerado e salvá-lo automaticamente em uma pasta específica.
O tempo gasto para escrever um e-mail cai de 30 minutos para 5 minutos.

Estratégia de referência hierárquica para lidar com a explosão de dados

Quando os arquivos ultrapassam mil, a janela de contexto de 200 mil tokens enche rápido. A partir daí, em vez de fazer ler todos os arquivos, deve-se usar um método de duas etapas: ler primeiro o master_index.md, que serve como um mapa geral. Esse método reduz o número de chamadas de API em quase 60%.

Para manter o desempenho, o gerenciamento de contexto deve ser inteligente:

Entenda e gerencie o consumo total de tokens com a seguinte composição: $T_{total} = T_{system} + T_{index} + T_{active\_files} + T_{history}$
Faça o Claude Code ler primeiro o índice mestre para encontrar apenas os caminhos de arquivos estritamente necessários para responder à pergunta.
Leia adicionalmente apenas os arquivos dos caminhos encontrados para criar a resposta e, se a conversa ficar longa, resuma o histórico com o comando /compact.
Ao adotar esta estrutura hierárquica, não importa o quanto os dados se acumulem, você poderá receber suporte imediato para tomada de decisão sem travamentos.

Criando um motor de automação de tarefas conectando Markdown do Obsidian ao Claude Code

Limpando os dados inúteis trazidos pelo Web Clipper

É necessário usar a biblioteca BeautifulSoup do Python para remover esse ruído.

No terminal, configure o ambiente digitando pip install beautifulsoup4 lxml.
No script, use o método decompose() para apagar classes CSS desnecessárias inteiras, como .ad-container ou .nav-menu.
Extraia apenas o corpo do texto com o parser lxml, salve em Markdown e coloque no cofre (vault) do Obsidian.
Dessa forma, o modelo foca apenas no conteúdo principal, reduzindo alucinações e derrubando o consumo de tokens para o nível de 25%.

Design de pastas para que o Claude Code não se perca

Utilize nomes de arquivos e opções de terminal para que o agente não fique perdido.

Adicione YYYY-MM-DD na frente de todos os nomes de arquivos para indicar quão fresca é a informação.
Ao executar o Claude Code, use a opção --newer-than para fazê-lo ler apenas arquivos alterados nas últimas 24 horas.
Na pasta 03_Project_Action, mantenha apenas arquivos com o status da tarefa anotado.
Com essa estrutura, o Claude evita a tolice de revirar todo o cofre. Graças a isso, buscas que levavam 10 minutos terminam em 30 segundos.

Preenchendo lacunas na busca com metadados YAML

Para o motor de trabalho de um empreendedor de conhecimento, três campos são suficientes:

Escreva topic para dividir o tema, source_importance para avaliar a importância e status para o estado da tarefa no topo da nota.
Use o plugin "YAML Toolkit" do Obsidian para aplicar essa regra a centenas de arquivos existentes de uma só vez.
No arquivo de configuração do Claude Code (CLAUDE.md), escreva: "Crie a lista de tarefas olhando apenas documentos cujo status seja Doing".
Aquele sofrimento de organizar materiais por 2 horas toda manhã se transforma em um estado onde você recebe o briefing de trabalho em apenas 10 minutos.

Rotina de briefing diário finalizada com uma linha de comando

A rotina de automação é montada da seguinte forma:

Crie um script shell (.sh ou .bat) contendo o comando claude --bare para aumentar a velocidade de inicialização.
Misture o comando find -mtime -1 no script para passar ao Claude apenas as notas criadas no último dia.
Use a função PostToolUse do Claude Code para corrigir erros de digitação no rascunho de e-mail gerado e salvá-lo automaticamente em uma pasta específica.
O tempo gasto para escrever um e-mail cai de 30 minutos para 5 minutos.

Estratégia de referência hierárquica para lidar com a explosão de dados

Para manter o desempenho, o gerenciamento de contexto deve ser inteligente:

Entenda e gerencie o consumo total de tokens com a seguinte composição: $T_{total} = T_{system} + T_{index} + T_{active\_files} + T_{history}$
Faça o Claude Code ler primeiro o índice mestre para encontrar apenas os caminhos de arquivos estritamente necessários para responder à pergunta.
Leia adicionalmente apenas os arquivos dos caminhos encontrados para criar a resposta e, se a conversa ficar longa, resuma o histórico com o comando /compact.
Ao adotar esta estrutura hierárquica, não importa o quanto os dados se acumulem, você poderá receber suporte imediato para tomada de decisão sem travamentos.

Criando um motor de automação de tarefas conectando Markdown do Obsidian ao Claude Code

Related Video

Obsidian RAG do Karpathy + Claude Code = TRAPAÇA

Criando um motor de automação de tarefas conectando Markdown do Obsidian ao Claude Code

Limpando os dados inúteis trazidos pelo Web Clipper

Design de pastas para que o Claude Code não se perca

Preenchendo lacunas na busca com metadados YAML

Rotina de briefing diário finalizada com uma linha de comando

Estratégia de referência hierárquica para lidar com a explosão de dados

Comments (0)

Criando um motor de automação de tarefas conectando Markdown do Obsidian ao Claude Code

Limpando os dados inúteis trazidos pelo Web Clipper

Design de pastas para que o Claude Code não se perca

Preenchendo lacunas na busca com metadados YAML

Rotina de briefing diário finalizada com uma linha de comando

Estratégia de referência hierárquica para lidar com a explosão de dados