Log in to leave a comment
No posts yet
File Markdown yang diambil dari web sering kali berisi tumpukan gangguan seperti iklan dan menu bar. Jika teks seperti ini tercampur, performa RAG (Retrieval-Augmented Generation) akan turun drastis. Faktanya, data yang tidak dimurnikan akan memecah atensi model, sedangkan Markdown yang tertata rapi akan meningkatkan akurasi pencarian. Dengan membuang teks yang tidak perlu, jumlah token yang dikonsumsi oleh LLM lokal juga berkurang lebih dari 30%, sehingga tidak ada uang yang terbuang percuma.
Anda harus menyingkirkan gangguan ini menggunakan pustaka BeautifulSoup dari Python.
pip install beautifulsoup4 lxml untuk menyiapkan lingkungan.decompose() untuk menghapus seluruh class CSS yang tidak perlu seperti .ad-container atau .nav-menu.lxml untuk mengekstrak isi utama saja, simpan sebagai Markdown, lalu masukkan ke dalam vault Obsidian.Ketika jumlah file membengkak hingga ratusan, model sepintar apa pun bisa kehilangan konteks. Jangan hanya menumpuk file, tetapi bagilah area berdasarkan status informasinya. Saya menggunakan struktur 3 tahap (01_Raw_Inbox, 02_Processed_Wiki, 03_Project_Action) dengan memodifikasi framework PARA. Ini memberikan panduan fisik bagi Claude Code tentang informasi mana yang harus dipercayai dan dijadikan referensi.
Gunakan nama file dan opsi terminal agar agen tidak kebingungan.
YYYY-MM-DD di depan semua nama file untuk memberi tahu seberapa segar informasi tersebut.--newer-than agar ia hanya membaca file yang berubah dalam 24 jam terakhir.03_Project_Action, letakkan hanya file yang berisi status pengerjaan.Pencarian teks sederhana tidak bisa membedakan apakah sebuah dokumen itu 'penting' atau 'sudah selesai'. Oleh karena itu, Anda perlu memasukkan YAML Frontmatter di bagian atas dokumen. Dengan adanya metadata, Anda bisa memberikan instruksi yang jauh lebih presisi kepada Claude Code.
Tiga field saja sudah cukup untuk mesin kerja seorang pengusaha pengetahuan (knowledge entrepreneur).
topic untuk membagi subjek, source_importance untuk menentukan tingkat kepentingan, dan status untuk status pengerjaan di bagian paling atas catatan.Claude Code yang berbasis terminal menunjukkan kekuatan aslinya saat bertemu dengan shell script. Cukup dengan mengetik satu perintah saat tiba di kantor, mesin yang menganalisis apa yang dipelajari kemarin hingga membuat draf email untuk dikirim hari ini akan selesai. Anda tidak perlu membuang energi setiap pagi untuk memikirkan apa yang harus dilakukan terlebih dahulu.
Susun rutinitas otomatisasi sebagai berikut:
.sh atau .bat) yang berisi perintah claude --bare untuk mempercepat waktu booting awal.find -mtime -1 ke dalam skrip untuk hanya memberikan catatan yang dibuat dalam satu hari terakhir kepada Claude.Jika jumlah file melebihi seribu, context window sebesar 200 ribu token pun akan cepat penuh. Mulai saat ini, jangan biarkan ia membaca semua file, tetapi gunakan metode 2 tahap dengan membuatnya membaca master_index.md terlebih dahulu, yang berfungsi sebagai peta keseluruhan. Metode ini mengurangi jumlah pemanggilan API hingga hampir 60%.
Untuk menjaga performa, Anda harus mengelola konteks dengan cerdas.
/compact.