عملاء الذكاء الاصطناعي يعشقون واجهات الأوامر السطرية (CLIs)

MMaximilian Schwarzmüller
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00بما أن وكلاء الذكاء الاصطناعي أصبحوا مفيدين أكثر فأكثر وأصبحوا واقعاً ملموساً
00:00:05في بعض المهام على الأقل، أرى أنه من المثير للاهتمام كيف نعود إلى نقطة البداية.
00:00:11وإليكم ما أعنيه. إذا ألقينا نظرة على تاريخ الحواسيب والإنترنت
00:00:16ككل، يمكننا ربما رسم مخطط لسهولة الاستخدام يبدو كالتالي.
00:00:23بالطبع هذا المخطط افتراضي تماماً ولكنكم ستفهمون قصدي. لقد بدأنا في السبعينيات
00:00:30أو في وقت ما قريباً من ذلك - لا تحاسبوني على عام محدد - ولكن في الأيام
00:00:36الأولى عندما كنت أنا وأنت - حسناً، لم أكن قد ولدت بعد - ولكن عندما لم تكن
00:00:41الأسر العادية تمتلك حتى حاسوباً، كان التفاعل مع الحواسيب نصياً فقط عبر واجهات
00:00:47أطر العمل النهائية أو سطر الأوامر بشكل أساسي. ثم ظهرت واجهات المستخدم الرسومية الغنية
00:00:54والمواقع المتطورة وكل تلك الأشياء الممتعة - وأنظمة التشغيل المصممة للمستخدمين العاديين -
00:01:01لم تصبح أمراً واقعاً إلا في التسعينيات والألفينيات وبالطبع استمرت في التطور حتى اليوم.
00:01:09ولا تزال تتطور بالطبع، لا تفهموني خطأ، فأنا لا أقول إن كل هذا سيتلاشى،
00:01:14ولكن هناك أمر واحد واضح تماماً وهو أنه مع وكلاء الذكاء الاصطناعي
00:01:22لدينا توجه قوي للعودة إلى المدخلات النصية، وواجهات سطر الأوامر، وأدوات CLI، و Markdown،
00:01:31و JSON، وكل تلك الأشياء الأساسية. ولا أقصد بذلك فقط
00:01:37أن لدينا أدوات مثل Claude Code التي لا تأتي بواجهة مستخدم رسومية -
00:01:43رغم وجود تطبيق لسطح المكتب إلا أنه يُستخدم أساساً كأداة سطر أوامر - لا أقصد ذلك فقط.
00:01:48بل أقصد أن كل هؤلاء الوكلاء، وهذه الأدوات الوكيلية - سموها ما شئتم -
00:01:54تتفوق حقاً في التفاعل مع أدوات سطر الأوامر الأخرى، والبرامج الأخرى التي
00:02:02يمكنها استدعاؤها عبر سطر الأوامر، فهي تفضل النصوص البسيطة والمنسقة مثل Markdown،
00:02:09وهنا يكمن بريقها الحقيقي. وهذا هو السبب في أن المزيد والمزيد من الشركات -
00:02:15على سبيل المثال قبل ساعات قليلة من تسجيلي لهذا الفيديو، أصدرت جوجل المزيد من أدوات
00:02:21سطر الأوامر. حيث أصدرت جوجل أداة CLI لـ Google Workspace. صدق أو لا تصدق، لم تكن موجودة
00:02:27حتى الآن، وهي أداة يمكنك استخدامها للتفاعل مع خدمات Google Workspace مثل Gmail
00:02:35و Google Drive عبر CLI رسمي. لقد كانت هناك حلول أخرى بالفعل -
00:02:41مثل GOG CLI الذي ابتكره بيتر شتاينبرجر، مؤسس OpenClaw - لقد بناه لأنه
00:02:48أراد طريقة برمجية تعتمد على سطر الأوامر للتفاعل مع خدمات جوجل ولم يكن ذلك متاحاً
00:02:54حتى قبل ساعات قليلة، أما الآن فقد أصبح متاحاً. وهذا الفيديو ليس برعاية جوجل
00:02:59أو أي شيء من هذا القبيل، بل من المثير للاهتمام رؤية المزيد من الشركات التي تقدم
00:03:04الخدمات وهي تصدر أدوات كهذه. خوادم MCP ستكون أمراً مشابهاً،
00:03:11رغم أن بروتوكولات MCP في رأيي لها عيوب عديدة، وأعتقد بقوة أننا سنرى أدوات سطر الأوامر
00:03:18وواجهات البرمجية (APIs) - وفي النهاية أدوات CLI مجرد غلاف للـ APIs - ستكون هي الطريقة الرئيسية
00:03:27لاستهلاك الخدمات عبر الأدوات الوكيلية. وإليكم مثالاً ملموساً لما أعنيه.
00:03:32على مدار الأيام والأسابيع الماضية، كنت أجرب وكيل PyCoding.
00:03:37وكيل PyCoding هو، إذا صح التعبير، بديل لـ Codex أو Claude Code. إنه أبسط بطريقة جيدة،
00:03:46ومحدود أكثر من حيث الميزات ولكنه قوي جداً ويمكنك استخدامه مع اشتراك Codex الخاص بك.
00:03:51هذا الفيديو ليس عن هذا الوكيل تحديداً ولا يهم حقاً
00:03:57سواء استخدمت هذا أو Codex أو Cursor أو غيرهم، فكلهم سيوصلونك للهدف.
00:04:01لكنني أحب هذه الأداة أيضاً، والأهم من ذلك، تماماً مثل Claude Code
00:04:07و Codex، يمكنك استخدامها في مهام غير برمجية رغم اسمها. على سبيل المثال،
00:04:13وكيل Py هذا هو المستخدم داخلياً بواسطة OpenClaw. لذا فهو القلب،
00:04:19القلب المنطقي لـ OpenClaw إن أردت. ثم أضاف OpenClaw بالطبع الكثير
00:04:24إليه مثل الذاكرة والقنوات كالتليجرام والواتساب وكل تلك الأشياء الرائعة.
00:04:30ولكن هذه مجرد أداة وكيلية واحدة يمكنك تشغيلها على نظامك للقيام بمهامك.
00:04:35يمكنك أيضاً بناء وكيلك الخاص بالطبع. ولدي دورة حول ذلك أغطي فيها كيف
00:04:40يعمل وكلاء الذكاء الاصطناعي فعلياً وما الفرق بينهم وبين تدفقات العمل، فغالباً
00:04:44قد تحتاج لتدفق عمل وليس وكيلاً حقيقياً. لدي دورة عن ذلك إذا أردت التعمق أكثر.
00:04:49كما أن لدي دورات عن Claude Code و Codex إذا كنت ترغب في معرفة المزيد.
00:04:54ولكن أياً كانت الأداة التي تستخدمها، فالمثير للاهتمام والواضح حقاً
00:04:58هو مدى قدرتهم على التفاعل مع أدوات سطر الأوامر (CLI) الأخرى. وهذا منطقي جداً
00:05:03لأنهم تدربوا على الكثير من أعمال سطر الأوامر واستخدام أدوات مثل curl، وأوامر
00:05:10سطر الأوامر مثل cd و ls، وكل أوامر لينكس المعروفة. لقد رأوا الكثير من ذلك
00:05:16في بيانات تدريبهم. ولم يروا فقط أوامر لينكس القياسية التي
00:05:21يعرفونها عن ظهر قلب، بل الأهم أنهم تعلموا كيفية استخدام هذه الأدوات. وكيفية ربطها
00:05:28معاً، وكيفية تمرير النتائج من أداة إلى أخرى. لقد رأوا كل ذلك
00:05:35وهم يتفوقون فيه. كما تعلموا أن بإمكانهم استخدام --help لمعرفة المزيد عن أي أداة.
00:05:41وهذا يضعهم في وضع ممتاز لاستخدام أدوات جديدة أيضاً. أدوات لم يروها
00:05:47في بيانات تدريبهم مثل أداة Google Workspace CLI الجديدة على سبيل المثال.
00:05:52بالطبع إذا أردت استخدام ذلك عبر وكيل، فهو لم يره في بيانات تدريبه.
00:05:57ولا يعرف كيفية استخدامه. ولكن إذا وجهته إليه، وربما أعطيته رابطاً
00:06:01للوثائق الرسمية، وحتى لو لم تفعل، فمن المرجح أن يتمكن من اكتشاف
00:06:05كيفية استخدامه عبر --help والانطلاق من هناك. لأنها ببساطة مجرد أداة CLI أخرى.
00:06:11والنماذج اللغوية الكبيرة تتفوق في النهاية في فهم ووصف واستخدام
00:06:17أدوات سطر الأوامر هذه.
00:06:20على سبيل المثال، بالأمس واجهت مشكلة بسيطة. كنت بحاجة لرفع
00:06:26ملف PDF إلى أحد المواقع. وأنتم تعرفون تلك المواقع التي تطلب رفع مجموعة مستندات
00:06:32كلها في ملف واحد وبشرط ألا يتجاوز حجم الملف 5 ميجابايت؟ نعم، كنت
00:06:38في أحد تلك المواقع. وبطبيعة الحال كان عليّ ضغط ملف الـ PDF ذاك.
00:06:43كان بإمكاني البحث عن موقع يقوم بذلك بدلاً مني، لكني لست من محبي
00:06:49رفع ملفاتي الخاصة إلى مواقع عشوائية. لذا لم أكن متأكداً. كان بإمكاني أيضاً
00:06:55البحث عن أداة في نظامي تساعدني في ذلك، لكني لا أملك اشتراك
00:07:01Adobe حالياً، لذا كان الأمر سيتطلب بعض البحث. وربما كنت سأنتهي
00:07:07برفعه لموقع مشبوه. حسناً، ليس مع الذكاء الاصطناعي. بالطبع كان بإمكاني استخدام Codex أو Claude
00:07:13أو Cursor لبرمجة أداة تحويل وضغط بسيطة. وربما كان ذلك
00:07:19لينجح أيضاً. لكن ما فعلته هو تشغيل وكيل Py الذي أستخدمه مع
00:07:26اشتراك Codex الخاص بي. وطلبت منه فقط إلقاء نظرة على ملف PDF ذاك وضغطه
00:07:33مع الحفاظ على الجودة قدر الإمكان.
00:07:36كان هذا كل شيء، طلبي الوحيد. وقد بدأ العمل فعلاً، ونفذ
00:07:41مجموعة من الأوامر في سطر الأوامر، وشغل بعض السكربتات الصغيرة. وبالمناسبة، أنا أشغل
00:07:46هذا على نظامي، لكني قمت بتثبيت إضافة للحماية (guardrails). إن Py أو PI هو الاسم الفعلي
00:07:53ولديه مفهوم الإضافات التي يمكنك تثبيتها. لذا ثبتُ إضافة تمنع
00:07:59الوكيل من مسح قرصي الصلب، على الأقل بالطريقة المباشرة. وكنت أيضاً
00:08:06أراقبه عن كثب بينما كان يصف ما ينوي القيام به. فتركته يقوم بعمله
00:08:11ونفذ الكثير من الخطوات هنا. وفي النهاية انتهى المهمة. وبالفعل نجح
00:08:18في ضغط المستند وجعله أصغر حجماً بكثير. ربما هذا مجرد مثال بسيط،
00:08:25وكانت هناك بدائل. لكن نقطتي هي أنه فعل كل ذلك في سطر
00:08:29الأوامر باستخدام أوامرنا وبرامجنا هناك. وبالطبع،
00:08:36كل هذا منطقي جداً لأننا نتحدث عن برامج تستخدم الحاسوب.
00:08:41وكل واجهات المستخدم الرسومية والمواقع الغنية بنيت للبشر، لي ولك.
00:08:46وهذا لن يختفي بالطبع. ولكن إذا أردنا أدوات مساعدة صغيرة، وكلاء ذكاء اصطناعي
00:08:53يعملون على أنظمتنا ويمكنهم القيام على الأقل ببعض المهام التي نقوم بها الآن،
00:08:59فعلينا منحهم طريقة لاستخدام الحاسوب بفعالية أكبر. لأن الواجهة
00:09:03الرسومية، أو التطبيق أو الموقع المصمم للإنسان ليس الطريقة المثلى لبرنامج
00:09:09حاسوبي بالطبع. حيث سيتعين عليه أخذ لقطة شاشة، ومعرفة مكان الأزرار،
00:09:13وتحريك الفأرة للزر، والنقر عليه، ثم أخذ لقطة شاشة أخرى ليرى ما في
00:09:18الصفحة الجديدة. هذا غير فعال بالمرة، ويستهلك الكثير من الرموز (tokens) ويستغرق وقتاً طويلاً. وأعني،
00:09:24لهذا السبب كان لدينا مفهوم واجهات البرمجية (APIs) قبل ظهور وكلاء الذكاء الاصطناعي
00:09:31والنماذج اللغوية الكبيرة بفترة طويلة. لأننا إذا كنا نكتب برنامجاً، سواء كان موقعاً أو تطبيقاً،
00:09:37وأردنا التفاعل مع برنامج آخر أو خدمة أخرى،
00:09:43فمن الطبيعي أننا كنا نستخدم API في الماضي ولم نحاول كتابة سكربت يستخدم
00:09:49موقعاً مصمماً للبشر. لهذا السبب توجد الـ APIs والـ CLIs، برامج سطر
00:09:56الأوامر، هي في النهاية مجرد أغلفة حول الـ APIs، على الأقل في حالة أدوات مثل
00:10:03Google Workspace CLI. ولكن هذا هو بالضبط نوع البرامج التي نحتاجها ونريد
00:10:10للوكيل أن يستهلكها لأنه لا يهتم بالأزرار الجميلة أو أي شيء من ذلك. هو يريد
00:10:15طريقة بسيطة لاستدعاء أوامر مختلفة لإنجاز المهام. ولهذا السبب يبدو الأمر
00:10:22منطقياً. ولهذا أيضاً أصبح الـ Markdown أكثر أهمية الآن من أي وقت مضى ولماذا
00:10:28تقدم معظم صفحات الوثائق زر نسخ صغيراً كهذا، مما يسهل
00:10:32نسخ المحتوى كـ Markdown لتتمكن من لصقه في نموذجك اللغوي المفضل
00:10:38أو جلسة الدردشة أو أداة البرمجة. ولماذا تدعم بعض المواقع أيضاً إضافة .md في نهاية
00:10:46الرابط للحصول على المقال بتنسيق Markdown لأننا نتجه نحو مستقبل حيث
00:10:52تكون بعض الخدمات والمحتويات مصممة أساساً ليتم استهلاكها من قبل الوكلاء.
00:10:58أعني، لنأخذ وثائق مكتبة أو إطار عمل مثل TanStack Start. إذا كنت
00:11:03تبني موقعاً باستخدام TanStack Start هذه الأيام، وبالطبع لا يهم أي تقنية
00:11:09تستخدم، فستفهم قصدي، فمن المرجح أن تفعل ذلك بمساعدة وكيل برمجة كـ Cursor
00:11:15أو غيره. وإذا أردت إخبار هؤلاء الوكلاء بكيفية استخدام المكتبة، أو إذا أردت
00:11:20توجيههم لمقال محدد في الوثائق، فلن ترغب في توجيههم لموقع كهذا.
00:11:25لا تريدهم أن يحملوا كود HTML، مما يستهلك الكثير من الرموز دون داعٍ.
00:11:32وهذا هو نفس السبب الذي يجعل أدوات سطر الأوامر (CLI) تصبح
00:11:38أكثر فأكثر أهمية لأننا ننتقل نحو مستقبل حيث سيتم إنجاز بعض المهام
00:11:42بمساعدة وكلاء الذكاء الاصطناعي أو بواسطتهم حصرياً. وهذا يعني بالطبع
00:11:49أنك إذا كنت تبني نوعاً من الخدمات غير المخصصة أساساً للاستهلاك
00:11:54البشري، فعليك التفكير بجدية في بناء واجهة CLI بالإضافة إلى توفير
00:12:02API وكل ما يلزم لكي يتمكن الناس مستقبلاً من استهلاك خدمتك عبر الوكلاء.
00:12:09وبالطبع، لا نزال في مرحلة مبكرة جداً. فغالبية الناس لا يهتمون
00:12:14بالوكلاء على الإطلاق. ومن المبكر جداً الجزم بمدى كفاءة هؤلاء الوكلاء وما هي
00:12:20المهام التي سيتمكنون من معالجتها في المستقبل. ربما سنبقى عالقين في المستوى الحالي
00:12:26حيث يمكنهم فعل بعض الأشياء، ولكن ليس كلها وبالتأكيد لا يزالون بحاجة لإشراف بشري.
00:12:31ولكن حتى في هذه الحالة، هناك مهام يمكن للوكلاء القيام بها ويمكنك جعلها
00:12:37أكثر فائدة وقوة عبر منحهم الأدوات المناسبة التي تسهل
00:12:42على الوكلاء التفاعل مع خدماتنا، والمواقع وغيرها. ولهذا السبب نحن نعود
00:12:49إلى نقطة البداية. من الواضح أن هذا لا يعني أن واجهات المستخدم الرسومية
00:12:55والمواقع ستختفي، فمن المحتمل أن تظل هناك تطبيقات أو مواقع
00:13:01مخصصة للاستهلاك البشري ولا معنى لاستهلاكها من قبل الوكلاء. أعني،
00:13:07شيء مثل Netflix. لا أرى فائدة كبيرة في أن يخبرني وكيل عما يدور حوله
00:13:13فيلم معين. أعتقد أنني أريد مشاهدته بنفسي. ولكن بالنسبة للعديد من الخدمات، خاصة في قطاع
00:13:21البرمجيات كخدمة (SaaS) أو الخدمات المهنية، فهذا هو الطريق للمضي قدماً بلا شك. أعتقد
00:13:28أننا في الأيام الأولى، ولكن من الواضح أن هناك تطوراً ملموساً يمكننا رؤيته هنا. على الأقل
00:13:34هذا هو رأيي. ولكن كالعادة، أريد معرفة رأيكم أنتم أيضاً. لذا يرجى مشاركته.
00:13:39أخبروني برأيكم، وما الذي ربما نسيته أو أغفلته. ونعم، دعونا
00:13:44نرى كيف سيبدو عالم أدوات سطر الأوامر (CLI) خلال عام أو عامين.

Key Takeaway

نحن نشهد عودة تاريخية إلى واجهات الأوامر السطرية (CLIs) كواجهة أساسية للتفاعل، حيث يفضل وكلاء الذكاء الاصطناعي كفاءة النصوص والبروتوكولات البرمجية على تعقيدات الواجهات الرسومية المصممة للبشر.

Highlights

التحول الجذري من واجهات المستخدم الرسومية (GUIs) بالعودة إلى واجهات الأوامر السطرية (CLIs) بسبب كفاءتها مع وكلاء الذكاء الاصطناعي.

وكلاء الذكاء الاصطناعي يفضلون النصوص البسيطة وتنسيقات مثل Markdown و JSON لأنها تستهلك رموزاً (Tokens) أقل وتسهل المعالجة البرمجية.

إصدار جوجل الأخير لأداة CLI لـ Google Workspace يعد مؤشراً قوياً على توجه الشركات الكبرى لدعم التفاعل البرمجي للوكلاء.

قدرة النماذج اللغوية الكبيرة على تعلم استخدام أدوات CLI جديدة من خلال قراءة الوثائق أو استخدام أمر المساعدة (--help) دون تدريب مسبق.

أهمية بناء واجهات CLI و APIs للمطورين لضمان بقاء خدماتهم قابلة للاستهلاك في مستقبل يهيمن عليه وكلاء الذكاء الاصطناعي.

الفرق الجوهري في الكفاءة بين استخدام الوكيل للواجهة الرسومية (عبر لقطات الشاشة) وبين التفاعل المباشر مع سطر الأوامر.

Timeline

العودة إلى الجذور: من النصوص إلى الرسومات والعودة مجدداً

يبدأ المتحدث باستعراض تاريخ تطور الحواسيب، مشيراً إلى أننا نمر بنقطة تحول تعيدنا إلى البدايات النصية. في السبعينيات، كان التعامل مع الحاسوب يتم عبر واجهات سطر الأوامر فقط لعدم وجود بدائل منزلية. ثم انتقل العالم في التسعينيات والألفينيات إلى الواجهات الرسومية والمواقع الغنية لتسهيل الاستخدام البشري. يوضح المتحدث أن ظهور وكلاء الذكاء الاصطناعي يقلب هذه الموازين حالياً. هذا المخطط الافتراضي لسهولة الاستخدام يظهر أن التوجه القادم يميل نحو المدخلات النصية مرة أخرى.

لماذا يعشق الوكلاء سطر الأوامر (CLI)؟

يشرح الفيديو تفضيل الوكلاء لأدوات مثل Markdown و JSON وواجهات البرمجية لأنها لغاتهم الطبيعية في التفاعل. يسلط الضوء على خطوة جوجل الأخيرة بإصدار CLI رسمي لـ Google Workspace، مما يتيح التعامل مع Gmail و Drive برمجياً. يذكر المتحدث أن أدوات مثل Claude Code تعتمد أساساً على سطر الأوامر حتى مع وجود تطبيقات سطح مكتب. هذا التوجه يثبت أن الشركات بدأت تدرك حاجة الوكلاء لطرق تواصل لا تعتمد على العناصر المرئية. يعتبر هذا القسم محورياً لفهم كيف ستصبح الـ CLIs الغلاف الأساسي لاستهلاك الخدمات في المستقبل.

تجارب عملية: وكيل PyCoding وضغط الملفات

يستعرض المتحدث تجاربه مع وكيل PyCoding كبديل لأدوات مثل Codex و Cursor لإنجاز مهام برمجية وغير برمجية. يوضح كيف أن هذه النماذج تدربت بكثافة على أوامر لينكس القياسية مثل curl و ls، مما جعلها تتقن ربط الأوامر ببعضها. الميزة الكبرى هي قدرة الوكيل على استكشاف أدوات لم يراها من قبل عبر أمر المساعدة (--help) أو قراءة الوثائق. يضرب مثالاً بكيفية توجيه الوكيل لرابط وثائق رسمي ليتعلم كيفية تنفيذ مهام معقدة بشكل آلي. هذا يؤكد أن المرونة في التعامل مع النصوص هي سر تفوق الذكاء الاصطناعي الحالي.

الكفاءة التقنية: سطر الأوامر مقابل واجهة المستخدم

يقدم المتحدث مثالاً واقعياً لمشكلة واجهته عند حاجته لضغط ملف PDF لرفعه على موقع يحدد الحجم بـ 5 ميجابايت. بدلاً من استخدام مواقع مشبوهة أو برامج باهظة، استخدم وكيل ذكاء اصطناعي محلي لتنفيذ المهمة عبر سطر الأوامر. يوضح أنه قام بتثبيت بروتوكولات حماية (guardrails) لمنع الوكيل من العبث بملفات النظام الحساسة. نجح الوكيل في ضغط الملف بجودة عالية عبر سلسلة من السكربتات الداخلية السريعة. هذه القصة تبرز الفائدة العملية للذكاء الاصطناعي في توفير الوقت وتجنب المخاطر الأمنية للمواقع الخارجية.

مستقبل تصميم الخدمات للاستهلاك غير البشري

ينتقد المتحدث عدم كفاءة الوكلاء عند التعامل مع واجهات الرسومية التي تتطلب لقطات شاشة ومحاكاة حركة الفأرة، واصفاً إياها بهدر للرموز والوقت. يؤكد أن الـ APIs والـ CLIs صممت أصلاً لتواصل البرامج مع بعضها، وهو ما يحتاجه الوكيل بالضبط. يشير إلى توجه المواقع لتوفير نسخ Markdown من مقالاتها لتسهيل نسخها إلى النماذج اللغوية. يدعو المطورين لبناء خدماتهم مع وضع "الاستهلاك عبر الوكيل" في الحسبان منذ البداية. هذا التحول يعني أن جودة الخدمة ستقاس بمدى سهولة وصول الوكلاء إليها برمجياً.

الخلاصة: التوقعات والآفاق المستقبلية

في الختام، يقر المتحدث بأننا لا نزال في مراحل مبكرة جداً وأن الواجهات الرسومية لن تختفي تماماً في مجالات مثل الترفيه (مثل Netflix). ومع ذلك، في قطاع الخدمات المهنية و البرمجيات كخدمة (SaaS)، يظل سطر الأوامر هو المستقبل الحتمي. يتوقع أن يتطور دور الوكلاء من مجرد مساعدين إلى منفذين مستقلين للمهام المعقدة تحت إشراف بشري. يشدد على أن تزويد الوكلاء بالأدوات الصحيحة هو ما سيجعلهم أكثر قوة وفائدة في حياتنا اليومية. ينهي الفيديو بدعوة الجمهور لمشاركة آرائهم حول شكل عالم الـ CLI في السنوات القادمة.

Community Posts

View all posts