मैंने AI एजेंट्स से बनी एक कंपनी चलाने की कोशिश की

BBetter Stack
컴퓨터/소프트웨어창업/스타트업경영/리더십AI/미래기술

Transcript

00:00:00मैंने तीन AI एजेंट्स को एक ही रेपो दिया, और उन सबने मिलकर एक कंपनी बना ली। एक ने
00:00:06फीचर बनाने की कोशिश की, एक ने आर्किटेक्चर को फिर से लिखा, और एक ने सभी टिकटों को संभाला।
00:00:12बिना किसी ढांचे के, हर मल्टी-एजेंट सेटअप धीरे-धीरे उलझन में बदल जाता है और भारी बिल बनाता है।
00:00:17यह Paperclip है, और यह इसे ठीक करने की कोशिश कर रहा है। एक कमांड आपको AI एजेंट्स के लिए
00:00:22ऑर्गनाइजेशन चार्ट, टिकट, बजट, ऑडिट लॉग और हार्टबीट्स के साथ लोकल कंट्रोल प्लेन देता है।
00:00:27इसने GitHub पर 64,000 से अधिक स्टार्स पार कर लिए हैं।
00:00:30चलिए कुछ ही मिनटों में कुछ AI एजेंट्स के साथ अपनी खुद की कंपनी सेटअप करते हैं।
00:00:33अब एजेंट्स के साथ एक बात है। एक अकेला एजेंट अच्छा लगता है। आप उसे काम देते हैं, वह कोड लिखता है।
00:00:44बहुत बढ़िया। फिर आप दूसरा एजेंट देते हैं, शायद तीसरा भी। और फिर होता यह है कि
00:00:51अचानक वह सब मैनेजमेंट के काम में बदल जाता है। काम का मालिक कौन है? सवाल यह है। कौन
00:00:57लक्ष्य को याद रख रहा है, और एजेंट जब गलत काम करने लगे तो उसे कौन रोकता है?
00:01:03यही वह समस्या है जिसे Paperclip हल करने की कोशिश कर रहा है। अकेले काम करने वाले एजेंट्स अच्छे नहीं होते।
00:01:08उपयोगी हैं, लेकिन तालमेल बिठाना मुश्किल है। Paperclip उन्हें एक टीम, या शायद एक कंपनी में बदल देता है।
00:01:13हम कंपनी का लक्ष्य तय करते हैं। एक ऑर्गनाइजेशन चार्ट बनाते हैं। शायद एक CEO, एक CTO,
00:01:20दो इंजीनियर और एक रिसर्च एजेंट हो। फिर Paperclip टिकटों, हार्टबीट्स,
00:01:27बजट, अप्रूवल और ट्रैसेबिलिटी के जरिए काम का तालमेल बिठाता है। हम काम देख सकते हैं, किसने सौंपा,
00:01:33उस पर वास्तव में कितना खर्च हुआ, और क्या वह अभी भी अंतिम लक्ष्य से जुड़ा है। कम अंदाजे वाली व्यवस्था?
00:01:39चलिए इसे लाइव देखते हैं। अगर आपको वर्कफ़्लो तेज़ करने वाले कोडिंग टूल्स पसंद हैं, तो
00:01:43सब्सक्राइब जरूर करें। हमारे वीडियो हर समय आते रहते हैं। ठीक है, अब यह देखिए। एक साफ टर्मिनल में,
00:01:49मैं बस NPX Paperclip AI onboard चलाऊँगा। यह लोकल सेटअप शुरू कर देता है। अब कुछ ही क्षणों
00:01:56बाद में, पेपरक्लिप डैशबोर्ड के साथ चल रहा है। मेरे पास स्थानीय सेवाएँ हैं, पोस्टग्रेस इसके साथ आता है,
00:02:03और ऑथेंटिकेशन भी। यह पूरा UI है जहाँ मैं वास्तव में एक नई कंपनी बना सकता हूँ। मैं
00:02:09एक नई कंपनी बनाऊँगा और उसे dev tools company कहूँगा, या जो कुछ भी आप बनाना चाहते हैं। इसके लिए,
00:02:14मैं यह लक्ष्य रखूँगा। लक्ष्य सरल है। मैं इस हफ्ते एक URL शॉर्टनर MVP बनाकर शिप करना चाहता हूँ।
00:02:20अब मैं एक CTO एजेंट जोड़ सकता हूँ। फिर मैं एडेप्टर्स के जरिए दो इंजीनियर जोड़ सकता हूँ। इनमें से एक
00:02:28इंजीनियर एजेंट बैकएंड का मालिक है। दूसरा फ्रंटएंड और टेस्ट कवरेज का मालिक है। अब, स्टार्ट करने
00:02:34से पहले, मैं बजट सेट करूँगा। और यह हिस्सा वास्तव में मायने रखता है क्योंकि लक्ष्य यह है कि
00:02:39एजेंट्स को मेरी API तब तक इस्तेमाल न करने दूँ जब तक बिल न फट जाए। नहीं, लक्ष्य नियंत्रित स्वायत्तता है। मुझे
00:02:46अपनी वर्किंग डायरेक्टरी का पाथ भी सेट करना होगा जहाँ कोड आउटपुट होगा। तो मैं उसे यहाँ सेट करूँगा।
00:02:50अब मैं उन हार्टबीट्स को दबा सकता हूँ और इसे शुरू कर सकता हूँ। और चलिए बोर्ड को देखते हैं। हार्टबीट पर
00:02:57एजेंट्स जाग जाते हैं। CTO लक्ष्य को टिकटों में तोड़ देता है। हमारे इंजीनियर यहाँ अब काम उठा रहे हैं।
00:03:05तो आप डेलिगेशन, टिकट, एंसेस्ट्री, स्टेटस चेंज, बजट काउंटर, यह सब एक साथ जुड़ा हुआ
00:03:10देख सकते हैं। और अब पहला इम्प्लीमेंटेशन टास्क पहले ही कोड कमिट की ओर बढ़ रहा है।
00:03:15इसे चलने में काफी समय लगा, लेकिन मुझे लगता है कि इन सभी एजेंट्स का एक साथ होना,
00:03:19तर्कसंगत लगता है, पर फिर भी यह सबसे तेज़ नहीं है, खासकर यदि आप इसे और अधिक स्केल करना चाहते हैं।
00:03:24यह अब चैट बॉक्स में बैठा एक एजेंट नहीं है। यह अब एक छोटी कंपनी है जो हमारे द्वारा बनाए गए
00:03:30इन एजेंट्स, CEO, CTO और इन सभी इंजीनियरों द्वारा चल रही है। अब यहीं लोग भ्रमित होते हैं।
00:03:37पहली नज़र में, Paperclip एक और एजेंट फ्रेमवर्क लगता है, एक और Crew AI, एक और AutoGen,
00:03:43या LangGraph स्टाइल वर्कफ़्लो। यह वास्तव में इसका उद्देश्य नहीं है। वे टूल्स तब अच्छे होते हैं
00:03:49जब आप एक वर्कफ़्लो चाहते हैं, है ना? उदाहरण के लिए, मुझे एक रिसर्चर, फिर प्लानर, फिर राइटर,
00:03:55फिर रिव्यूअर चाहिए। हाँ, बिल्कुल वह उपयोगी है। इसलिए हम उनका उपयोग करते हैं। लेकिन Paperclip
00:04:01एक स्तर ऊपर का लक्ष्य रख रहा है। यह अब सिर्फ वर्कर्स के बारे में नहीं है। यह वह कंपनी है जो
00:04:07चीजों को बनाने में मदद करने के लिए इस ऑर्गनाइजेशन चार्ट में इन वर्कर्स को घेरे हुए है। इसे ऐसे सोचें।
00:04:13एक अकेला एजेंट सिर्फ एक कर्मचारी है। वर्कफ़्लो आपकी चेकलिस्ट की तरह है। Paperclip मैनेजर है,
00:04:20ऑर्गनाइजेशन चार्ट, टिकट बोर्ड, बजट सिस्टम, ऑडिट लॉग है। वह मैनेजर के रूप में Paperclip है।
00:04:25प्रबंधक के रूप में। तो जो सवाल आप अभी खुद से पूछ रहे हैं, क्या कोई एजेंट कोड लिख सकता है? खैर,
00:04:30हम पहले से ही जानते हैं कि यह कर सकता है। यही इसका उद्देश्य है। यह अब उसे जेनरेट कर रहा है। कठिन सवाल ये हैं,
00:04:36क्या वह सही काम पर लग सकता है? क्या वह तब रुक सकता है जब उसे वास्तव में रुकना चाहिए? क्या वह काम सौंप सकता है?
00:04:43क्या मैं देख सकता हूँ कि यहाँ क्या हो रहा है? और उन सबका संक्षिप्त उत्तर है हाँ, यह कर सकता है।
00:04:49Paperclip आपको स्टेट, हार्टबीट्स, बजट, पदानुक्रम, लॉग देता है। यह पोर्टेबल टेम्पलेट्स
00:04:55और एक डैशबोर्ड भी देता है जो चैट विंडो के बजाय एजेंट्स के लिए Jira या Linear जैसा महसूस होता है।
00:05:02आप एक एजेंट को प्रॉम्प्ट देना बंद करते हैं और इस मिनी संस्था को नियंत्रित करना शुरू करते हैं। हम में से कई
00:05:07शायद अभी भी टर्मिनल्स और सेटअप्स के बीच भटकते रहते हैं। एक टर्मिनल Claude Code के लिए, एक टैब Cursor के लिए, एक एजेंट
00:05:13रिसर्च के लिए, एक स्क्रिप्ट GitHub इश्यूज के लिए, है ना? इन सभी अलग-अलग विंडोज़ के बीच हम भटकते हैं,
00:05:18लेकिन Paperclip उन सबको एक साझा ऑपरेटिंग मॉडल देता है। अब इस सब के लिए मेंटल मॉडल
00:05:24हमारे लिए वास्तव में बदल जाता है। तो यह कहने के बजाय कि, “अरे, कृपया यह फीचर बनाओ,”
00:05:30हम वास्तव में अब कुछ ऐसा कह रहे हैं कि इस कंपनी का लक्ष्य इस प्रोडक्ट को
00:05:35शिप करना है। यहाँ कंपनी के नियम हैं। यहाँ ऑर्गनाइजेशन चार्ट है और यहाँ बजट है।
00:05:41यहाँ वह सब है जिसे अप्रूवल की ज़रूरत है। अब काम शुरू करो। अब ईमानदारी से कहूँ तो, संरचना अच्छी है,
00:05:46है ना? टिकट, एंसेस्ट्री, डेलिगेशन, यह सब, है ना? इसके होने से मल्टी-एजेंट काम के बारे में सोचना आसान है।
00:05:52यह कहने के बजाय कि एजेंट ने कुछ किया, शाबाश। आप वास्तव में देख सकते हैं कि वह काम किसने
00:05:58सौंपा, वह क्यों मौजूद है और हमारे कोड में कहाँ फिट बैठता है। बजट सेट करने की क्षमता भी बहुत बड़ी बात है।
00:06:05कई एजेंट टूल्स लागत को ऐसी चीज़ मानते हैं जिसे आप बाद में चेक करते हैं। Paperclip लागत को
00:06:12पूरे कंट्रोल लूप का हिस्सा बनाता है। हम काम शुरू करने से पहले बजट तय करते हैं। यह सेल्फ-होस्टेड और ओपन
00:06:17सोर्स है। फिर से, यहाँ बड़ी जीत है। तो आप इसे लोकली चला सकते हैं, इसकी जांच कर सकते हैं, इसे बदल सकते हैं और
00:06:22उन एजेंट्स से जोड़ सकते हैं जिन्हें आप पहले से इस्तेमाल कर रहे हैं। लेकिन इन सब अच्छी चीज़ों के साथ ही, वही संरचना
00:06:27जो Paperclip को शक्तिशाली बनाती है, वह बहुत कष्टप्रद भी हो सकती है। अगर आपके नियम खराब हैं, तो एजेंट्स
00:06:32बकवास टिकट बना सकते हैं। मुझे यहाँ एक सरल URL शॉर्टनर चाहिए था, लेकिन अब शायद मेरे CTO एजेंट ने
00:06:39यह पूरी दूसरी योजना खोल दी है जो मुझे चाहिए ही नहीं थी। तो उसके लिए कोई धन्यवाद नहीं। टोकन बर्न भी
00:06:45वास्तविक है, है ना? इसीलिए हमारे पास इसे नियंत्रित करने के लिए बजट है, लेकिन यह खराब प्रॉम्प्ट या अस्पष्ट नियम
00:06:52परिभाषाओं को ठीक नहीं करता। और दोस्तों, अगर आपकी skill MD फाइल्स खराब हैं, तो आपकी कंपनी एक भ्रमित स्टार्टअप की तरह व्यवहार करती है,
00:06:59है ना? तो skills MD, उसी को मजबूती चाहिए, है ना? और अंत में, ईमानदारी से,
00:07:03अगर आप एक साधारण स्क्रिप्ट लिख रहे हैं, तो यह पूरी तरह से ओवरकिल है। मैं बस इसे टेस्ट करना चाहता था। मुझे
00:07:08इस प्रोजेक्ट के लिए इसकी ज़रूरत नहीं थी, लेकिन अगर आप सिर्फ एक एजेंट से फाइल को समराइज करना या बग पैच करना चाहते हैं,
00:07:13तो आपको इसकी ज़रूरत नहीं है, है ना? यह बहुत कुछ बनाने और साथ में काम करने वाले कई एजेंट्स के लिए है।
00:07:18यह निश्चित रूप से उपयोग के लायक है, लेकिन यह हर चीज़ के लिए नहीं है। अगर आपको कोडिंग टूल्स और
00:07:23इस तरह के टिप्स पसंद हैं, तो सब्सक्राइब जरूर करें। हम आपसे दूसरे वीडियो में मिलेंगे।

Key Takeaway

Paperclip एकल AI प्रॉम्प्टिंग के बजाय एक प्रबंधित संगठनात्मक ढांचे का उपयोग करता है जहाँ बजट सीमाओं और पदानुक्रमित टिकट प्रणालियों के माध्यम से मल्टी-एजेंट स्वायत्तता को नियंत्रित किया जाता है।

Highlights

  • Paperclip GitHub पर 64,000 से अधिक स्टार्स वाला एक ओपन-सोर्स फ्रेमवर्क है जो AI एजेंट्स के लिए लोकल कंट्रोल प्लेन प्रदान करता है।

  • यह सिस्टम ऑर्गनाइजेशन चार्ट, टिकट बोर्ड, बजट काउंटर और ऑडिट लॉग के माध्यम से कई एजेंट्स के बीच तालमेल बिठाता है।

  • NPX Paperclip AI onboard कमांड के जरिए पोस्टग्रेस और ऑथेंटिकेशन के साथ एक स्थानीय डैशबोर्ड और UI सेटअप किया जा सकता है।

  • बजट नियंत्रण सुविधा API खर्च को रोकने के लिए स्वायत्तता शुरू होने से पहले वित्तीय सीमाएँ निर्धारित करने की अनुमति देती है।

  • एजेंटों की गतिविधियों को 'हार्टबीट्स' के माध्यम से ट्रिगर किया जाता है जहाँ CTO जैसा उच्च-स्तरीय एजेंट लक्ष्यों को छोटे टास्क टिकटों में विभाजित करता है।

Timeline

मल्टी-एजेंट सिस्टम में अराजकता और समाधान

  • बिना ढांचे के कई एजेंट्स एक ही रिपॉजिटरी में काम करते समय अक्सर परस्पर विरोधी कार्य करते हैं और भारी बिल बनाते हैं।
  • Paperclip एक स्थानीय कंट्रोल प्लेन के रूप में कार्य करता है जो एजेंट्स को जवाबदेही और दृश्यता प्रदान करता है।
  • एजेंटों के बीच लक्ष्य की स्पष्टता और गलत दिशा में जाने से रोकने के लिए एक केंद्रीय प्रबंधन की आवश्यकता होती है।

तीन AI एजेंट्स को बिना किसी नियम के एक ही प्रोजेक्ट सौंपने पर एक एजेंट फीचर बनाता है जबकि दूसरा आर्किटेक्चर बदल देता है। इससे उत्पन्न होने वाली उलझन को Paperclip हल करता है। यह GitHub पर 64,000 स्टार्स प्राप्त कर चुका है और एजेंट्स को एक संगठित टीम में बदलने के लिए ऑडिट लॉग और हार्टबीट्स जैसे उपकरणों का उपयोग करता है।

एक वर्चुअल AI कंपनी का सेटअप और संचालन

  • NPX कमांड के माध्यम से एक स्थानीय डैशबोर्ड सेटअप किया जाता है जिसमें डेटाबेस और ऑथेंटिकेशन शामिल होता है।
  • प्रत्येक एजेंट को विशिष्ट भूमिकाएँ जैसे CTO, बैकएंड इंजीनियर या फ्रंटएंड इंजीनियर सौंपी जाती हैं।
  • बजट सेटिंग्स का उपयोग करके API खर्च पर सख्त नियंत्रण रखा जाता है ताकि अनियंत्रित खर्च न हो।

एक URL शॉर्टनर MVP बनाने के लक्ष्य के साथ कंपनी बनाई जाती है। CTO एजेंट मुख्य लक्ष्य को टिकटों में तोड़ता है जिसे अन्य इंजीनियर एजेंट उठाते हैं। काम शुरू करने से पहले वर्किंग डायरेक्टरी का पाथ और बजट निर्धारित किया जाता है। हार्टबीट सिग्नल मिलते ही एजेंट्स सक्रिय हो जाते हैं और डेलिगेशन और स्टेटस चेंज के माध्यम से काम कोड कमिट की ओर बढ़ता है।

वर्कफ़्लो फ्रेमवर्क बनाम संगठनात्मक ऑपरेटिंग मॉडल

  • Paperclip केवल एक वर्कफ़्लो टूल नहीं है बल्कि यह एक साझा ऑपरेटिंग मॉडल है जो पूरी संस्था को प्रबंधित करता है।
  • यह चैट विंडो के बजाय Jira या Linear जैसे डैशबोर्ड का अनुभव प्रदान करता है।
  • यह व्यक्तिगत प्रॉम्प्टिंग के बजाय पूरी मिनी-संस्था के नियंत्रण पर केंद्रित है।

Crew AI या AutoGen जैसे टूल्स विशिष्ट कार्यों के क्रम के लिए उपयोगी हैं। Paperclip इन सबसे एक स्तर ऊपर काम करता है क्योंकि यह ऑर्गनाइजेशन चार्ट और पदानुक्रम पर आधारित है। यह अलग-अलग टूल्स जैसे Cursor या Claude Code के बीच भटकने के बजाय सभी को एक साझा स्टेट और ट्रैसेबिलिटी प्रदान करता है। इससे यह पता चलता है कि कौन सा काम किसने सौंपा और उसकी लागत कितनी थी।

ढांचे के लाभ और सीमाएँ

  • बजट नियंत्रण सुविधा लागत को बाद के विचार के बजाय पूरे कंट्रोल लूप का हिस्सा बनाती है।
  • खराब प्रॉम्प्ट या अस्पष्ट 'skills.md' फाइलें एजेंट्स को अप्रासंगिक और अनावश्यक टिकट बनाने के लिए प्रेरित कर सकती हैं।
  • साधारण स्क्रिप्ट या एकल फ़ाइल कार्यों के लिए यह ढांचा अनावश्यक रूप से जटिल है।

संरचना होने से काम की उत्पत्ति और उसके कोड में फिट होने की प्रक्रिया स्पष्ट होती है। हालांकि टोकन की खपत अभी भी एक चुनौती है जिसे बजट के माध्यम से नियंत्रित किया जाना चाहिए। यदि नियम और परिभाषाएँ मजबूत नहीं हैं तो कंपनी एक भ्रमित स्टार्टअप की तरह व्यवहार करती है। यह उपकरण बड़े प्रोजेक्ट्स के लिए सबसे उपयुक्त है जहाँ कई एजेंट्स को एक साथ काम करने की आवश्यकता होती है।

Community Posts

No posts yet. Be the first to write about this video!

Write about this video