Log in to leave a comment
No posts yet
Arquivos Markdown capturados da web são aglomerados de ruído, como anúncios e barras de menu. Quando esse tipo de texto está misturado, o desempenho do RAG (Geração Aumentada de Recuperação) cai visivelmente. Na realidade, dados não refinados dispersam a atenção do modelo, enquanto um Markdown limpo e organizado aumenta a precisão da busca. Ao eliminar textos desnecessários, os tokens consumidos pelo LLM local diminuem em mais de 30%, evitando desperdício de dinheiro.
É necessário usar a biblioteca BeautifulSoup do Python para remover esse ruído.
pip install beautifulsoup4 lxml.decompose() para apagar classes CSS desnecessárias inteiras, como .ad-container ou .nav-menu.lxml, salve em Markdown e coloque no cofre (vault) do Obsidian.Quando os arquivos aumentam para centenas, até o modelo mais inteligente perde o contexto. Não apenas acumule arquivos; divida as áreas de acordo com o status da informação. Eu utilizo uma estrutura de 3 etapas (01_Raw_Inbox, 02_Processed_Wiki, 03_Project_Action), adaptando o framework PARA. Isso fornece diretrizes físicas sobre quais informações o Claude Code deve confiar e consultar.
Utilize nomes de arquivos e opções de terminal para que o agente não fique perdido.
YYYY-MM-DD na frente de todos os nomes de arquivos para indicar quão fresca é a informação.--newer-than para fazê-lo ler apenas arquivos alterados nas últimas 24 horas.03_Project_Action, mantenha apenas arquivos com o status da tarefa anotado.Uma simples busca de texto não consegue distinguir se um documento é "importante" ou se é uma "tarefa concluída". Por isso, é necessário inserir um YAML Frontmatter no topo do documento. Com metadados, você pode dar comandos muito mais sofisticados ao Claude Code.
Para o motor de trabalho de um empreendedor de conhecimento, três campos são suficientes:
topic para dividir o tema, source_importance para avaliar a importância e status para o estado da tarefa no topo da nota.O Claude Code baseado em terminal mostra seu verdadeiro poder quando encontra scripts shell. Ao chegar no trabalho, basta digitar um comando para que o motor analise o que foi estudado ontem e até extraia o rascunho do e-mail a ser enviado hoje. Não há necessidade de gastar energia pensando no que fazer primeiro a cada manhã.
A rotina de automação é montada da seguinte forma:
.sh ou .bat) contendo o comando claude --bare para aumentar a velocidade de inicialização.find -mtime -1 no script para passar ao Claude apenas as notas criadas no último dia.Quando os arquivos ultrapassam mil, a janela de contexto de 200 mil tokens enche rápido. A partir daí, em vez de fazer ler todos os arquivos, deve-se usar um método de duas etapas: ler primeiro o master_index.md, que serve como um mapa geral. Esse método reduz o número de chamadas de API em quase 60%.
Para manter o desempenho, o gerenciamento de contexto deve ser inteligente:
/compact.