Hermes: Agen Berbasis AI yang Terus Belajar dan Semakin Cerdas Setiap Hari

BBetter Stack
Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00Oke, Hermes adalah agen AI sumber terbuka besutan perusahaan Amerika, Nous Research, yang
00:00:06dapat meningkatkan kemampuannya sendiri. Jadi, semakin sering Anda menggunakannya, ia semakin mahir. Ia merenung,
00:00:10belajar, dan berkembang sendiri, ia tidak pernah melupakan apa pun yang Anda katakan dan bahkan membuat
00:00:16keahliannya sendiri. Namun, apakah itu cukup untuk menggantikan sesuatu seperti OpenClaw, yang mendukung lebih banyak
00:00:22saluran, memiliki isolasi yang lebih baik, dan jauh lebih matang? Tekan tombol langganan dan mari kita bahas.
00:00:30Jadi, nama Hermes, tentu saja, berasal dari dewa pembawa pesan Yunani. Dan dari sanalah
00:00:37simbol ini berasal. Anda akan melihatnya lebih banyak nanti di video. Namun saat ini,
00:00:42saya sudah membuat video tentang OpenClaw, yang bagus, tapi punya banyak fitur yang tidak akan
00:00:47saya gunakan secara pribadi. Dan NanoClaw, yang memiliki rangkaian fitur jauh lebih sedikit, tetapi dibangun di atas
00:00:52SDK agen Claude, yang sekarang kurang bisa saya gunakan karena aturan aneh terkait penggunaan
00:00:59langganan Claude dengan alat pihak ketiga. Jadi sekarang saya sedang mencari asisten AI baru
00:01:04dan mari kita lihat apakah Hermes, agen AI yang belajar mandiri ini, dapat mengisi kekosongan tersebut. Saya akan menggunakannya
00:01:09untuk membuat cuitan promosi bagi saya berdasarkan video masa lalu yang telah saya buat. Dan saya akan memberinya
00:01:14beberapa naskah dan arahan untuk mencapai tahap itu. Sekarang, ini tugas yang cukup kecil, tetapi fokusnya adalah
00:01:20lebih untuk melihat apakah Hermes dapat mengingat gaya penulisan saya dan semua umpan balik yang akan saya berikan untuk membuat
00:01:26cuitan yang saya suka tanpa saya memintanya berulang-ulang. Mari kita mulai. Jadi saya sudah selesai
00:01:30menginstal Hermes menggunakan perintah ini, yang sangat sederhana dan memproses segalanya mulai dari
00:01:35memilih model. Saya memilih OpenRouter dengan Gemma 4, tetapi jika perangkat keras saya mampu,
00:01:40saya akan menjalankannya secara lokal dan menghubungkannya ke Hermes, platform perpesanan, dan alat untuk CLI. Jika Anda
00:01:45pernah menggunakan OpenClaw, seluruh proses ini akan terasa sangat familier. Saya juga telah mengaturnya di VPS untuk
00:01:51berjaga-jaga, tetapi jika mau, Anda bisa dengan mudah menginstalnya secara lokal di mesin Anda. Jadi dari sini,
00:01:55saya akan mengetik perintah Hermes, yang akan memulai obrolan baru dengan menampilkan simbol Hermes serta
00:01:59alat dan keahlian yang tersedia di sini. Catatan, saat Anda menjalankan perintah Hermes, ia membuat
00:02:04sesi baru dan tidak melanjutkan sesi sebelumnya kecuali ditentukan, sama seperti Claude Code. Di sini saya
00:02:08akan memberinya perintah. Saya ingin Anda membantu saya menulis cuitan berdasarkan naskah video saya.
00:02:12Mari kita lalui prosesnya. Setelah beberapa saat, ia memberikan tanggapan,
00:02:16yang strukturnya saya sukai. Jadi, saya akan memberinya perintah lanjutan. Saya punya naskah di dalam
00:02:21folder naskah, pelajari naskah tersebut untuk memahami gaya penulisan dan karakter suara saya. Saya juga memberitahunya
00:02:25target audiens dan panjang cuitan yang saya inginkan. Jadi sekarang ia menggunakan beberapa alat untuk mencari
00:02:30di file saya dan setelah beberapa saat ia menganalisis naskah saya untuk memberi rincian gaya saya.
00:02:34Katanya saya pragmatis dan skeptis, itu benar. Saya berpusat pada pengembang dan saya transparan
00:02:40serta mudah dipahami. Ia juga menyusun strategi untuk target audiens saya, yang tampilannya saya sukai.
00:02:45Tapi saya berubah pikiran. Meski saya sempat bilang ingin cuitannya sekitar 210 karakter,
00:02:50saya sebenarnya ingin cuitannya sedikit lebih panjang. Jadi saya akan memberinya perintah baru. Dan saya perhatikan
00:02:54prosesnya agak lama dan menghabiskan banyak konteks. Jadi yang bisa saya lakukan adalah mengubah model di tengah
00:02:59sesi dengan menjalankan perintah /model dan menentukan model yang saya inginkan. Dalam hal ini, saya ingin
00:03:04GLM 5 Turbo. Sekarang ia sudah beralih ke model tersebut. Saya akan memberinya perintah baru agar
00:03:08cuitannya lebih panjang. Dan ia memberikan respons jauh lebih cepat, tetapi juga menambahkan banyak informasi ke
00:03:13memori tanpa saya beri tahu. Jadi ia mengubah panjangnya dari 210 ke 400 dan mengubah gaya
00:03:19cuitan yang saya inginkan. Mari kita lihat apakah saya benar-benar bisa menghasilkan cuitan yang bagus dari naskah terbaru saya.
00:03:23Dan ia berhasil memberikan percobaan pertama yang cukup bagus, tapi ada beberapa hal yang tidak akan
00:03:28saya katakan secara pribadi seperti "berkeringat" dan saya tidak akan memakai kata "luar biasa". Saya akan memakai frasa "sangat
00:03:34bagus". Dan setelah beberapa penyesuaian, ia menghasilkan cuitan yang saya rasa benar-benar akan saya gunakan di
00:03:39profil saya. Dan ia menyimpan semuanya ke memori. Saya akan memintanya untuk membuat sebuah keahlian. Jadi lebih mudah bagi
00:03:44saya untuk menulis cuitan di masa depan. Dan sekarang ia menggunakan keahlian manajer keahlian untuk mulai membuat
00:03:49sebuah keahlian. Mari kita lihat aksinya. Dan lihatlah, ia sudah menuliskan cuitan untuk saya dengan beberapa pilihan,
00:03:54dan saya bisa memilih yang paling saya sukai. Ia bahkan langsung membuat utas yang bisa saya gunakan
00:03:59untuk menulis banyak cuitan jika saya mau. Jadi secara teknis, karena ia mengingat segalanya,
00:04:04jika saya membuat sesi Hermes yang baru, mengubah model dari bawaan dan bertanya apakah ia tahu bagaimana
00:04:09saya suka menulis cuitan saya, ia memberikan respons yang memberitahu saya dengan tepat bagaimana saya suka menulis
00:04:14cuitan saya, bahkan sampai jenis emoji yang suka saya gunakan. Sekarang Anda mungkin bertanya-tanya bagaimana Hermes ini
00:04:19mampu menarik semua informasi ini dari memori tanpa menghabiskan token Anda. Begini,
00:04:24memori disimpan dalam file eksternal. Bisa berupa file memory.md atau pemroses eksternal seperti
00:04:30super memory, mem0, atau open viking jika Anda mengonfigurasinya. Dan memori dimuat di awal setiap sesi atau diambil sebelumnya.
00:04:38Namun itu bukan versi lengkapnya. Faktanya, itu adalah versi padat yang dibatasi sekitar tiga
00:04:43setengah ribu karakter, atau kira-kira 700 token tergantung modelnya. Namun semua sesi
00:04:49disimpan di dalam basis data SQLite menggunakan FTS5 untuk pencarian teks lengkap. Jadi jika Anda meminta Hermes untuk mengingat
00:04:56apa yang Anda katakan kemarin, ia akan masuk ke basis data, melakukan pencarian, dan memberi Anda
00:05:01informasi tersebut. Ia juga melakukan sesuatu yang agak aneh. Ia memampatkan sesi Anda di atas 50% jendela konteks,
00:05:06yang berbeda dari sesuatu seperti Claude Code, yang melakukannya di angka 80%. Tapi saya rasa sulit untuk
00:05:11menentukan takaran yang pas tergantung modelnya. Jadi 50% adalah angka perkiraan yang bagus. Namun apa yang dilakukannya alih-alih
00:05:17sekadar memampatkan semuanya, ia menghapus keluaran dari pemanggilan alat yang lama dan menyimpan bagian awal
00:05:23dan akhir sesi, namun memampatkan bagian tengahnya. Inilah yang sebenarnya tersimpan di basis data
00:05:28SQLite, bukan percakapan lengkapnya itu sendiri. Ia juga mengingatkan dirinya sendiri setiap sekitar 10 giliran untuk menyimpan informasi
00:05:35penting ke memori dan juga untuk menulis sebuah keahlian kapan pun diperlukan. Sekarang saya tahu sangat
00:05:39sulit untuk melihat kekuatan penuh Hermes dalam sesi demo singkat yang saya berikan ini, tetapi semoga
00:05:44Anda bisa memperkirakan seberapa baik ia akan mengingat dan membuat keahlian berdasarkan informasi
00:05:50yang Anda berikan. Dan sebenarnya saya akan lebih sering menggunakannya. Jadi bulan ini atau mungkin bulan
00:05:54berikutnya, saya akan fokus menggunakan Hermes sebagai asisten pribadi utama saya dengan model yang sangat murah
00:05:59seperti GLM dan saya akan mengabari Anda bagaimana hasilnya. Tapi seperti biasa, beri tahu saya pendapat Anda di kolom komentar.
00:06:04Sekali lagi, jangan lupa untuk berlangganan dan sampai jumpa lagi, selamat memprogram.

Key Takeaway

Hermes membedakan diri sebagai agen AI otonom yang menggunakan penyimpanan memori eksternal dan pemampatan konteks 50% untuk menciptakan asisten yang terus belajar tanpa kehilangan riwayat interaksi pengguna.

Highlights

Hermes adalah agen AI sumber terbuka besutan Nous Research yang mampu meningkatkan kemampuannya sendiri melalui proses belajar mandiri dari interaksi pengguna.

Memori agen disimpan secara eksternal menggunakan file memory.md atau basis data SQLite dengan FTS5 untuk pencarian teks lengkap tanpa menghabiskan jendela konteks model.

Sistem melakukan pemampatan sesi secara otomatis saat penggunaan mencapai 50% dari jendela konteks untuk menjaga efisiensi token.

Agen ini memiliki kemampuan membuat keahlian (skills) secara otomatis untuk mengotomatisasi tugas-tugas berulang seperti penulisan cuitan dengan gaya bahasa tertentu.

Instalasi Hermes dilakukan melalui perintah CLI sederhana yang mencakup pemilihan model dari penyedia seperti OpenRouter atau koneksi lokal.

Setiap 10 giliran percakapan, Hermes secara otomatis memperbarui memori internalnya untuk menyimpan informasi penting dan menyesuaikan strategi bantuan.

Timeline

Mekanisme Belajar Mandiri Hermes

  • Hermes merupakan agen AI yang mampu merenung dan mengembangkan keahlian baru secara mandiri tanpa campur tangan manual.
  • Sistem ini mempertahankan ingatan jangka panjang atas semua instruksi dan umpan balik yang diberikan oleh pengguna.
  • Kebutuhan akan asisten baru muncul karena adanya batasan penggunaan langganan Claude dengan alat pihak ketiga.

Agen ini dirancang untuk mengatasi keterbatasan model AI statis dengan cara mengintegrasikan umpan balik pengguna langsung ke dalam inti operasinya. Pengujian dilakukan dengan tugas penulisan cuitan promosi untuk melihat kemampuan agen dalam menangkap gaya bahasa unik tanpa pengulangan instruksi. Fokus utamanya adalah evolusi kemampuan agen seiring bertambahnya frekuensi penggunaan.

Proses Instalasi dan Konfigurasi Model

  • Instalasi dilakukan melalui satu perintah CLI yang memproses pemilihan model dan koneksi platform perpesanan.
  • Pengguna dapat memilih model berbiaya rendah seperti Gemma 4 atau GLM melalui OpenRouter untuk efisiensi biaya.
  • Setiap perintah awal memulai sesi baru yang bersih kecuali pengguna menentukan sesi tertentu untuk dilanjutkan.

Fleksibilitas instalasi memungkinkan Hermes berjalan di mesin lokal maupun Virtual Private Server (VPS). Pengguna memiliki kontrol penuh untuk menghubungkan agen ke berbagai alat CLI dan platform perpesanan lainnya. Struktur sesi yang terpisah memastikan manajemen konteks yang lebih rapi mirip dengan alur kerja pada Claude Code.

Analisis Gaya dan Personalisasi Konten

  • Agen mampu menganalisis file naskah eksternal untuk mengidentifikasi karakteristik suara seperti pragmatis, skeptis, dan transparan.
  • Perpindahan model dapat dilakukan di tengah sesi menggunakan perintah khusus tanpa kehilangan kemajuan tugas.
  • Keahlian baru yang dibuat secara otomatis memungkinkan pembuatan utas Twitter lengkap dengan preferensi emoji yang spesifik.

Hermes mendeteksi profil audiens dan merancang strategi konten yang sesuai dengan data yang tersedia di folder lokal. Meskipun ada perubahan instruksi di tengah jalan, seperti penambahan panjang karakter, agen tetap mampu menyesuaikan output dengan cepat. Hasil akhirnya adalah serangkaian pilihan cuitan yang mencerminkan kepribadian pengguna secara akurat.

Arsitektur Memori dan Manajemen Konteks

  • Memori disimpan dalam bentuk padat sekitar 3.500 karakter atau 700 token untuk efisiensi sistem.
  • Basis data SQLite dengan fitur FTS5 digunakan untuk mencari informasi spesifik dari percakapan masa lalu secara instan.
  • Pemampatan sesi dilakukan dengan menghapus output pemanggilan alat yang lama sambil mempertahankan bagian awal dan akhir sesi.

Sistem memori eksternal memastikan bahwa informasi penting tidak membebani penggunaan token model utama. Hermes melakukan pembersihan konteks lebih agresif dibandingkan agen lain dengan memampatkan jendela konteks pada level 50%. Rutinitas penyimpanan memori setiap 10 giliran memastikan tidak ada detail penting yang terlewatkan dalam penggunaan jangka panjang.

Community Posts

View all posts