Playwright CLI बनाम MCP Server: Claude Code के लिए वास्तव में कौन सा बेहतर है?

BBetter Stack
Computing/SoftwareInternet Technology

Transcript

00:00:00Playwright CLI आपके कोडिंग एजेंट के साथ Playwright का उपयोग करने का सबसे नया तरीका है, जो आपको
00:00:04लोकल और सेशन स्टोरेज मैनेज करने, स्नैपशॉट लेने, टैब मैनेज करने – मूल रूप से आपके टर्मिनल के भीतर
00:00:09Playwright इंजन की पूरी शक्ति देता है।
00:00:12लेकिन कोई Playwright MCP सर्वर के बजाय इसका उपयोग क्यों करेगा?
00:00:17असल में, उन टूल्स से और अधिक CLI क्यों बनाए जा रहे हैं जो पहले MCP सर्वर थे?
00:00:22सब्सक्राइब बटन दबाएं और चलिए इसके बारे में विस्तार से जानते हैं।
00:00:24आइए एक साधारण काम पर Playwright CLI और MCP सर्वर दोनों का परीक्षण करके शुरुआत करें।
00:00:31मैं इससे एक टूल टेस्ट करने में मदद मांगूँगा जिस पर मैं ट्विटर से वीडियो डाउनलोड करने के लिए
00:00:35काम कर रहा हूँ।
00:00:36मैं Playwright से इस ट्वीट का लिंक लेने, उसे यहाँ पेस्ट करने, वीडियो निकालने,
00:00:40फिर स्क्रीनशॉट लेने से पहले 10 सेकंड प्रतीक्षा करने और फिर लोकल स्टोरेज को साफ़ करने के लिए कहूँगा
00:00:45ताकि अगले एजेंट को एकदम नई शुरुआत मिले।
00:00:48हम पहले इसे Claude Code का उपयोग करके Playwright CLI के साथ आजमाएंगे, और यदि हम इसे इंस्टॉल करते हैं, तो
00:00:54हमारे पास यहाँ स्किल उपलब्ध होनी चाहिए।
00:00:56ध्यान दें कि यह केवल 68 टोकन लेता है।
00:00:59तो अब मैं इसे यह प्रॉम्प्ट देने जा रहा हूँ, जो एजेंट को स्पष्ट रूप से Playwright CLI स्किल का
00:01:03उपयोग करने के लिए कहता है, ताकि चीजें थोड़ी आसान हो जाएं।
00:01:06अब मैं एंटर दबाऊंगा, फिर यह स्किल लोड करता है, इस URL को टेक्स्ट बॉक्स में डालता है,
00:01:11Extract Video पर क्लिक करता है, फिर यह 10 सेकंड के लिए प्रतीक्षा करेगा।
00:01:13अब इसने स्क्रीनशॉट ले लिया है, लोकल स्टोरेज साफ़ कर दिया है, और ब्राउज़र बंद कर दिया है।
00:01:17तो अब यह सब हो गया है, यह कहता है कि स्क्रीनशॉट यहाँ सेव किया गया है, और अगर हम इसे देखें,
00:01:21तो हम देख सकते हैं कि यह दिखाता है कि वीडियो सफलतापूर्वक डाउनलोड हो गया था।
00:01:24और इस पूरी प्रक्रिया में लगभग 16% टोकन का उपयोग हुआ है।
00:01:27अब चलिए MCP सर्वर का उपयोग करके यही चीज़ आज़माते हैं।
00:01:29हम यह जाँचने के लिए MCP कमांड का उपयोग कर सकते हैं कि यह इंस्टॉल है या नहीं।
00:01:33और आगे बढ़ने से पहले, आइए कॉन्टेक्स्ट पर एक नज़र डालते हैं।
00:01:35यदि आप ऊपर स्क्रॉल करें, तो हम देख सकते हैं कि पहले से ही 15% कॉन्टेक्स्ट का उपयोग किया जा रहा है, क्योंकि
00:01:41ये सभी MCP टूल्स लोड हो रहे हैं, जो लगभग 3.6K टोकन का उपयोग करते हैं।
00:01:46ठीक है, तो इसे ध्यान में रखते हुए, हम उसी प्रॉम्प्ट का उपयोग करने जा रहे हैं।
00:01:50और ध्यान दें कि मैं CLI स्किल के बजाय Playwright MCP सर्वर टूल्स का उपयोग कर रहा हूँ।
00:01:55तो इसने MCP सर्वर का उपयोग किया है, जो एक नया ब्राउज़र खोलता है।
00:01:59फिर इसने इनपुट में लिंक पेस्ट कर दिया है।
00:02:01फिर यह बटन पर क्लिक करने वाला है।
00:02:02मैंने गौर किया है कि MCP सर्वर CLI की तुलना में कहीं अधिक अनुमति मांगता है, जो ठीक है।
00:02:08और इसे स्क्रीनशॉट लेने में कुछ समस्याएँ हुई हैं, जिसका कारण शायद यह हो सकता है कि मेरे पास
00:02:12पहले से ही इस नाम की एक फ़ाइल है।
00:02:13मैंने वास्तव में Playwright MCP सर्वर के साथ फिर से कोशिश की, और भले ही इसने एक
00:02:17अलग स्क्रीनशॉट नाम के साथ कोशिश की, इसे स्क्रीनशॉट निकालने में कई बार समस्या हुई।
00:02:22और अब यह समाप्त हो गया है।
00:02:23यह स्क्रीनशॉट लेने के अलावा बाकी सब कुछ करने में सक्षम था।
00:02:26लेकिन अब आइए कॉन्टेक्स्ट पर नज़र डालते हैं, और हम देख सकते हैं कि इसने 35K का उपयोग किया है, जो 18% है।
00:02:32तो CLI की तुलना में बस थोड़ा अधिक, जिसका बड़ा हिस्सा MCP टूल्स द्वारा लिया गया था।
00:02:37लेकिन वास्तव में कार्यों के उसी सेट को करने और थोड़ा कम कॉन्टेक्स्ट उपयोग करने का एक तरीका है,
00:02:43जिसके बारे में मैं वीडियो में थोड़ा बाद में बात करूँगा।
00:02:45अब मुझे पता है कि यह सिर्फ एक उदाहरण है, और ऐसी स्थितियाँ भी हो सकती हैं जहाँ MCP सर्वर
00:02:51कार्य के आधार पर Playwright CLI से कम टोकन का उपयोग करे, हालाँकि मुझे इसमें संदेह है।
00:02:56और आप यह भी सोच रहे होंगे कि, 16 और 18% के बीच का अंतर इतना अधिक नहीं है।
00:03:02लेकिन CLI के MCP सर्वर की तुलना में अन्य लाभ भी हैं।
00:03:06डिफ़ॉल्ट रूप से, Playwright MCP सर्वर सभी उपलब्ध टूल्स को एक्सपोज़ नहीं करता है।
00:03:11वास्तव में, आपको PDF जनरेशन या ट्रेसिंग जैसे अतिरिक्त टूल्स का उपयोग करने के लिए उन्हें
00:03:16चुनना (opt-in) होगा क्योंकि वे बहुत अधिक कॉन्टेक्स्ट लेते हैं।
00:03:19हालाँकि, CLI में वह सीमा नहीं है।
00:03:22वास्तव में, सभी टूल्स शुरुआत से ही उपलब्ध हैं।
00:03:25और CLI न केवल एजेंटों के लिए अच्छा है, यह इंसानों के लिए भी अच्छा है, क्योंकि उन कार्यों के लिए जिन्हें
00:03:29आप बार-बार करते हैं, या एंड-टू-एंड टेस्टिंग के लिए भी, आप एक साधारण बैश स्क्रिप्ट बना सकते हैं
00:03:34जिसे परिणाम सत्यापित करने के लिए एक इंसान भी चला सकता है, और एक एजेंट भी।
00:03:39लेकिन इसका मतलब यह नहीं है कि MCP सर्वर बेकार है, क्योंकि यदि आप एक ऐसा एजेंट लूप बना रहे हैं
00:03:44जिसे आप कहीं भी चलाना चाहते हैं, जैसे ब्राउज़र में, डेस्कटॉप और मोबाइल ऐप्स पर, न कि केवल
00:03:49टर्मिनल में, तो MCP सर्वर उसके लिए एकदम सही है, क्योंकि यह एक मानक प्रोटोकॉल है जिसे
00:03:54एजेंट टूल्स तक पहुँचने के लिए उपयोग करते हैं, और चूंकि Playwright JavaScript या TypeScript कोड चलाता है, आप
00:03:59इस कोड को किसी भी वातावरण में चला सकते हैं जो JavaScript रनटाइम का समर्थन करता है।
00:04:03इसके अलावा, MCP सर्वर डिफ़ॉल्ट रूप से हेडर्स मोड में चलता है, जबकि CLI हेडलेस मोड में चलता है,
00:04:09क्योंकि इसे कोडिंग एजेंटों में बैकग्राउंड में चलाने के लिए डिज़ाइन किया गया है।
00:04:13और यदि आप Playwright MCP सर्वर में टोकन कम करने की परवाह करते हैं, तो आप कुछ
00:04:17टूल्स को चालू या बंद करके इसे कॉन्फ़िगर कर सकते हैं।
00:04:20वास्तव में, यदि आपका लक्ष्य यथासंभव कम टोकन का उपयोग करना है, तो आपको Playwright
00:04:26CLI का भी उपयोग नहीं करना चाहिए, क्योंकि सेल्स एजेंट ब्राउज़र हुड के नीचे Playwright चलाता है, लेकिन इसमें
00:04:32Rust CLI है, जो इसे तेज़ बनाता है, और इसे Playwright की तुलना में कम टोकन उपयोग करने के लिए डिज़ाइन किया गया है,
00:04:38जैसा कि आपने मेरे पहले उदाहरण में देखा।
00:04:39एजेंट ब्राउज़र के बारे में सब कुछ जानने और अपने कोडिंग एजेंटों के ब्राउज़िंग कौशल को
00:04:43अगले स्तर पर ले जाने के लिए अगला वीडियो देखें।

Key Takeaway

Claude Code जैसे कोडिंग एजेंटों के लिए Playwright CLI अपनी दक्षता, कम टोकन खपत और पूर्ण टूल एक्सेस के कारण MCP सर्वर से बेहतर विकल्प साबित होता है।

Highlights

Playwright CLI टर्मिनल के भीतर ब्राउज़र ऑटोमेशन की पूरी शक्ति देता है, जिससे लोकल स्टोरेज और सेशन मैनेज करना आसान हो जाता है।

MCP सर्वर की तुलना में Playwright CLI कम टोकन का उपयोग करता है, जो इसे Claude Code जैसे AI एजेंटों के लिए अधिक कुशल बनाता है।

CLI के सभी टूल्स डिफ़ॉल्ट रूप से उपलब्ध होते हैं, जबकि MCP सर्वर में PDF जनरेशन जैसे अतिरिक्त फीचर्स के लिए ऑप्ट-इन करना पड़ता है।

MCP सर्वर एक मानक प्रोटोकॉल है जो ब्राउज़र और मोबाइल जैसे विभिन्न वातावरणों में एजेंटों को काम करने की अनुमति देता है।

यदि मुख्य लक्ष्य टोकन बचाना और गति बढ़ाना है, तो Rust-आधारित 'एजेंट ब्राउज़र' (Agent Browser) एक बेहतर विकल्प हो सकता है।

Timeline

Playwright CLI और MCP का परिचय

यह खंड Playwright CLI को कोडिंग एजेंटों के साथ उपयोग करने के सबसे नए तरीके के रूप में पेश करता है। वक्ता बताते हैं कि यह टूल टर्मिनल के भीतर ही स्नैपशॉट लेने और टैब प्रबंधित करने जैसी क्षमताएं प्रदान करता है। यहाँ मुख्य प्रश्न यह उठाया गया है कि डेवलपर्स MCP सर्वर के बजाय CLI को क्यों प्राथमिकता दे रहे हैं। यह चर्चा CLI के बढ़ते चलन और उसके तकनीकी लाभों को समझने के लिए एक आधार तैयार करती है। अंत में, दर्शकों को इन दोनों के बीच के व्यावहारिक अंतर को समझने के लिए आमंत्रित किया जाता है।

व्यावहारिक परीक्षण: ट्विटर वीडियो डाउनलोडर

इस खंड में एक ट्विटर वीडियो डाउनलोडर टूल का उपयोग करके Playwright CLI का लाइव परीक्षण किया गया है। एजेंट को लिंक पेस्ट करने, वीडियो निकालने और फिर स्क्रीनशॉट लेकर स्टोरेज साफ़ करने का निर्देश दिया गया है। CLI ने इस पूरी प्रक्रिया को बहुत ही सुचारू रूप से और केवल 68 टोकन के साथ सफलतापूर्वक पूरा किया। वक्ता दिखाते हैं कि कैसे पूरी प्रक्रिया में केवल 16% कॉन्टेक्स्ट विंडो का उपयोग हुआ, जो इसकी उच्च दक्षता को दर्शाता है। यह उदाहरण साबित करता है कि CLI सरल कार्यों के लिए कितना तेज़ और सटीक हो सकता है।

MCP सर्वर के साथ तुलना और चुनौतियाँ

यहाँ वही कार्य Playwright MCP सर्वर का उपयोग करके दोहराया गया है, जहाँ शुरुआत में ही 15% कॉन्टेक्स्ट का उपयोग हो जाता है। परीक्षण के दौरान MCP सर्वर को स्क्रीनशॉट लेने में बार-बार समस्याओं का सामना करना पड़ा और इसने अधिक अनुमतियाँ भी मांगीं। अंततः इसने लगभग 18% (35K टोकन) का उपयोग किया, जो CLI की तुलना में थोड़ा अधिक है। वक्ता ने नोट किया कि यद्यपि अंतर कम लग सकता है, लेकिन जटिल कार्यों में यह अंतर बढ़ सकता है। यह खंड MCP सर्वर की कुछ सीमाओं और सेटअप की जटिलताओं पर प्रकाश डालता है।

CLI बनाम MCP: फीचर्स और लाभ

यह हिस्सा दोनों टूल्स के बीच के मुख्य तकनीकी लाभों और अंतरों का विश्लेषण करता है। वक्ता बताते हैं कि CLI में सभी फीचर्स जैसे PDF जनरेशन शुरुआत से ही खुले होते हैं, जबकि MCP में उन्हें मैन्युअल रूप से चुनना पड़ता है। CLI इंसानों के लिए बैश स्क्रिप्ट के माध्यम से उपयोग करना भी आसान बनाता है, जो एंड-टू-एंड टेस्टिंग में मदद करता है। हालांकि, MCP सर्वर को एक मानक प्रोटोकॉल के रूप में सराहा गया है जो किसी भी JavaScript रनटाइम वातावरण में चल सकता है। यह तुलना डेवलपर्स को उनके विशिष्ट उपयोग के आधार पर सही टूल चुनने में मदद करती है।

निष्कर्ष और भविष्य के विकल्प

अंतिम खंड में हेडलेस बनाम हेडेड मोड के अंतर और टोकन अनुकूलन के बारे में बात की गई है। CLI डिफ़ॉल्ट रूप से बैकग्राउंड में चलने के लिए हेडलेस मोड का उपयोग करता है, जबकि MCP हेडेड मोड में चलता है। वक्ता 'एजेंट ब्राउज़र' का भी उल्लेख करते हैं जो Rust CLI पर आधारित है और Playwright से भी कम टोकन का उपयोग करता है। यह सुझाव दिया गया है कि यदि दक्षता सर्वोच्च प्राथमिकता है, तो वैकल्पिक टूल्स पर विचार करना चाहिए। वीडियो का समापन अगले वीडियो के सुझाव के साथ होता है जो ब्राउज़िंग कौशल को बेहतर बनाने पर केंद्रित है।

Community Posts

No posts yet. Be the first to write about this video!

Write about this video