Log in to leave a comment
No posts yet
टर्मिनल अब केवल मनुष्यों के लिए नहीं रह गया है। आपने iTerm2 या VS Code के बिल्ट-इन टर्मिनल में AI एजेंट चलाते समय स्क्रीन के धीमे होने (lag) का अनुभव किया होगा। पुराने टर्मिनल, जो मानव इनपुट गति के लिए डिज़ाइन किए गए थे, AI की उस गति को नहीं संभाल पाते जो प्रति मिलीसेकंड हजारों लाइनों का कोड जनरेट करती है। बैकग्राउंड में एजेंट क्या कर रहा है, यह न जान पाने के कारण होने वाला इंतज़ार डेवलपर के प्रवाह (flow) को तोड़ने का मुख्य कारण है।
अब टर्मिनल को एक साधारण इनपुट विंडो से आगे बढ़कर AI-विशिष्ट OS इंटरफ़ेस के रूप में विकसित होना चाहिए। libghostty पर आधारित उच्च-प्रदर्शन वाले टर्मिनल Cmux और Claude Code को जोड़कर, आप अपनी विकास उत्पादकता को भौतिक रूप से विस्तारित कर सकते हैं। यहाँ बिना किसी देरी के समानांतर (parallel) कोडिंग वर्कफ़्लो बनाने की प्रमुख रणनीतियाँ दी गई हैं।
Cmux केवल एक साधारण टर्मिनल एमुलेटर नहीं है। Mitchell Hashimoto के नेतृत्व में विकसित libghostty इंजन से लैस, यह AI एजेंटों के विशाल लॉग डेटा को प्रोसेस करने के लिए हार्डवेयर-त्वरित रेंडरिंग का उपयोग करता है। जहाँ पारंपरिक टर्मिनल टेक्स्ट दिखाने के लिए CPU पर निर्भर होते हैं, वहीं Cmux Metal GPU त्वरण का उपयोग करता है।
इसका अंतर्निहित libghostty-vt पार्सर SIMD (Single Instruction, Multiple Data) अनुकूलन के माध्यम से प्रति सेकंड 100MB से अधिक डेटा प्रोसेसिंग क्षमता प्रदर्शित करता है। जब एजेंट बड़े पैमाने पर रिफैक्टरिंग लॉग स्ट्रीम करता है, तब भी यह UI की प्रतिक्रियाशीलता (responsiveness) को पूरी तरह बनाए रखता है। Electron-आधारित ऐप्स के विपरीत, इसे Swift और AppKit में लिखा गया है, जिससे इसकी मेमोरी दक्षता जबरदस्त है। Unix डोमेन सॉकेट का उपयोग करके यह JSON-RPC 2.0 संचार करता है, जिससे एजेंट और टर्मिनल के बीच विलंबता (latency) लगभग शून्य हो जाती है।
वह युग समाप्त हो गया है जब हम AI एजेंट की इस बात पर भरोसा कर लेते थे कि उसने कोड बदल दिया है और वह ठीक काम कर रहा है। हमें एजेंट को सीधे ब्राउज़र खोलने और उसके व्यवहार को सत्यापित करने में सक्षम बनाना होगा। Cmux सीधे टर्मिनल के बगल में WebKit-आधारित ब्राउज़र प्लेन रखने की सुविधा प्रदान करता है।
एजेंट पूरे HTML DOM के बजाय एक्सेसिबिलिटी ट्री स्नैपशॉट पढ़ता है। इस विधि के माध्यम से, पूरी संरचना को समझने के लिए आवश्यक टोकन की खपत को 90% से अधिक कम किया जा सकता है। साथ ही, यह बटन क्लिक या फ़ॉर्म इनपुट जैसे इंटरैक्शन को सटीक रूप से करने के लिए विशिष्ट पहचानकर्ताओं (unique identifiers) का उपयोग करता है।
ब्राउज़र कौशल सेटअप गाइड
cmux browser open-split कमांड का उपयोग करें।--allow-file-access फ्लैग के साथ एजेंट के एक्सेस अधिकारों को बारीकी से नियंत्रित करें।किसी बड़े प्रोजेक्ट को एक एकल एजेंट को सौंपने में संदर्भ खोने (context loss) का बड़ा जोखिम होता है। सबसे प्रभावी तरीका एक समानांतर वर्कफ़्लो है जहाँ कार्य को विभाजित किया जाता है और विभिन्न सब-एजेंटों को उप-कार्य सौंपे जाते हैं। भूमिका विभाजन मॉडल के माध्यम से प्रत्येक एजेंट की विशेषज्ञता को अधिकतम करें।
| एजेंट की भूमिका | मुख्य उपकरण और मॉडल | मुख्य रणनीति |
|---|---|---|
| संरचना विश्लेषण | ls -R, grep |
पूर्ण निर्भरता ग्राफ और परिवर्तन प्रभाव मानचित्र बनाना |
| लॉजिक विश्लेषण | Haiku मॉडल | एल्गोरिदम की जटिलता और एज केस की पहचान करना |
| कोड कार्यान्वयन | Sonnet मॉडल | यूनिट टेस्ट पास करना और लिंट एरर मुक्त कार्यान्वयन |
डेटा हानि को रोकने के लिए, सब-एजेंटों को निर्देश दें कि वे अपने विश्लेषण को हमेशा JSON टेम्पलेट के रूप में वापस करें। प्लेन टेक्स्ट में महत्वपूर्ण तकनीकी विवरण छूटने की संभावना अधिक होती है। इसके अलावा, एक ही गलती को बार-बार ठीक करने के अनंत लूप (infinite loop) से बचने के लिए maxTurns को 10 बार तक सीमित करना सुरक्षित है।
जब कई एजेंट बैकग्राउंड में काम कर रहे हों, तो प्रत्येक की प्रगति की व्यक्तिगत रूप से जाँच करना डेवलपर की ऊर्जा बर्बाद करता है। Cmux इसे विजुअल ट्रिगर्स के साथ हल करता है।
cmux read-screen कमांड के साथ वर्तमान स्क्रीन का सटीक टेक्स्ट डेटा निकालें और उसे फिर से इनपुट के रूप में प्रदान करें।आप एजेंट को जितने अधिक अधिकार देंगे, सुरक्षा उपाय उतने ही सख्त होने चाहिए। न्यूनतम विशेषाधिकार के सिद्धांत (principle of least privilege) के अनुसार, .env जैसी संवेदनशील फाइलों को disallowedTools सेटिंग्स में निर्दिष्ट करके पहुंच को पूरी तरह से ब्लॉक करें। बड़े पैमाने पर फ़ाइल विलोपन या इंफ्रास्ट्रक्चर परिवर्तन कार्यों के लिए, हमेशा --permission-mode को सक्रिय करें ताकि मानवीय अंतिम स्वीकृति की आवश्यकता हो।
तकनीकी श्रेष्ठता उपकरणों के प्रदर्शन से आती है, लेकिन परिणामों की स्थिरता डेवलपर की डिज़ाइन क्षमता पर निर्भर करती है। Cmux और Claude Code का संयोजन एक डेवलपर को केवल कोड लिखने वाले मजदूर से ऊपर उठाकर एजेंटों की सेना का नेतृत्व करने वाले एक ऑर्केस्ट्रेटर (ओरकेस्ट्रा संचालक) के रूप में पदोन्नत करता है। libghostty के प्रदर्शन और बुद्धिमान अधिसूचना प्रणाली का लाभ उठाकर आधुनिक विकास परिवेश के जटिल संज्ञानात्मक भार को नाटकीय रूप से कम करें।