أنثروبيك تطلق طريقة جديدة لـ 'ترميز الكود بحدس'

AAI LABS
AI/미래기술컴퓨터/소프트웨어

Transcript

00:00:00المشكلة الرئيسية مع وكلاء الذكاء الاصطناعي هي نافذة السياق المحدودة، والتي تقيد ما يتذكرونه من الإجراءات السابقة.
00:00:06عندما نُسند إلى
00:00:07"كلود كود"
00:00:07مهمة أكبر، فإنه يضغط السياق عدة مرات أثناء محاولته تنفيذ ميزة واحدة، ناسياً المهمة الرئيسية التي طُلب منه تنفيذها، مما يجعله أقل فعالية للمهام طويلة الأمد.
00:00:17أصدرت
00:00:17"أنثروبيك"
00:00:18للتو حلاً يعتمد على كيفية عمل الفرق الحقيقية في بيئة هندسية فعلية.
00:00:22لقد حددوا سببين رئيسيين لفشله في المهام الطويلة.
00:00:26حاول الكثير منا تنفيذ تطبيقات كاملة أو ميزات كبيرة دفعة واحدة، والقيام بالكثير يتسبب في نفاد سياق النموذج.
00:00:34بعد الضغط المتكرر، يتم تحديث نافذة السياق بالميزة وهي مكتملة جزئياً فقط، دون أي ذاكرة لتقدم الميزة، مما يؤدي إلى تنفيذ غير مكتمل.
00:00:43المشكلة الثانية هي أنه، بسبب قدرات الاختبار الأقل، يضع
00:00:46"كلود"
00:00:47علامة
00:00:47"مكتملة"
00:00:48على الميزات غير المختبرة.
00:00:49يفترض أن الميزة مكتملة، حتى لو لم تعمل بشكل صحيح بالفعل.
00:00:53كان حلهم هو استخدام وكيل تهيئة ووكيل برمجة بتناغم، مستوحى من كيفية عمل فرق البرمجيات الحقيقية.
00:00:59هذا سير العمل مخصص في الأصل للوكلاء الذين تبنيهم بنفسك، لكنني أدركت أنه يمكن تطبيقه على حالات
00:01:05"كلود كود"
00:01:05أيضاً.
00:01:06يركز الوكيل الأول على تهيئة وكيل البرمجة الخاص بك بشكل صحيح، وعليك التحلي بالصبر هنا لأنه يستغرق بعض الوقت.
00:01:12لدي مشروع Next.js فارغ وأرغب في بناء مترجم بايثون عبر الإنترنت.
00:01:16قبل البدء، أنشئ ملف Claude.md باستخدام أمر التهيئة (init).
00:01:20هذا الملف هو وثيقة لقاعدة التعليمات البرمجية الخاصة بك ويوجد في جذر مشروعك، ويحتوي على نظرة عامة وجميع المعلومات الهامة.
00:01:27بعد ذلك، أنشئ ملف JSON لقائمة الميزات في جذر المشروع.
00:01:30يجب أن يسرد جميع الميزات وخطوات الاختبار المقابلة لها أيضاً، مع وضع علامة
00:01:34"فاشلة مبدئياً"
00:01:35على جميع الاختبارات، لإجبار
00:01:36"كلود"
00:01:37على اختبارها.
00:01:38نستخدم JSON بدلاً من Markdown لأن ملفات JSON أسهل في الإدارة ضمن السياق.
00:01:43بما أن
00:01:43"كلود"
00:01:44يمكنه اختبار التعليمات البرمجية فقط، وليس الواجهة التي نراها في المتصفح، فقد قمت بربط Puppeteer لاختبار المتصفح.
00:01:49بعد ذلك، أنشئ نصاً برمجياً للتهيئة (init script) لتوجيه بدء تشغيل خادم التطوير وملف لتتبع التقدم حتى يتمكن النظام من تتبع حالة اكتمال المشروع.
00:01:57كإرشادات، يحتاج
00:01:58"كلود"
00:01:59إلى تحديث ملف progress.md بعد كل تشغيل واختبار كل ميزة بعد التنفيذ.
00:02:04أهم ممارسة هي الالتزام بـ Git.
00:02:07نحن نقلل من أهمية الالتزام بحالة قابلة للدمج.
00:02:10التزامات Git بسجلات واضحة تُظهر ما تم إنجازه وتسمح لك بالتراجع إذا فشل التنفيذ.
00:02:15أخيراً، يجب ألا يغير
00:02:17"كلود"
00:02:17قائمة الميزات بخلاف وضع علامة
00:02:19"مُنفذة"
00:02:19على الميزات.
00:02:20بعد أن أصبحت البيئة جاهزة، ننتقل إلى جزء البرمجة.
00:02:23كانت الفكرة هي تنفيذ كل ميزة على حدة من ملف JSON الخاص بالميزات.
00:02:27قام
00:02:27"كلود"
00:02:28أيضاً بإنشاء رسائل التزام وصفية بعد كل ميزة تم اختبارها، وقام أيضاً بتشغيل المتصفح عند الحاجة.
00:02:33بمجرد التحقق من أن التطبيق يعمل، قام بتحديث حقول JSON من
00:02:37"خطأ"
00:02:37إلى
00:02:38"صحيح"
00:02:38وتحديث ملف progress.md بما تم إنجازه حتى الآن.
00:02:42أخيراً، قام بتثبيت التغييرات وتحقق من نجاح التثبيت.
00:02:45ميزة هذا النهج التدريجي هي أنه حتى إذا انتهت الجلسة، يمكنك استئناف العمل من حيث توقفت بالضبط.
00:02:51يتم تتبع كل شيء في سجلات Git، لذلك لا داعي للقلق بشأن إتلاف التعليمات البرمجية.
00:02:55يمكن لـ
00:02:56"كلود"
00:02:56فهم المشروع من سجلات Git وملف التقدم، وليس من التعليمات البرمجية نفسها، لذا يمكنك استئناف الجلسة بسهولة.
00:03:02موجهك التالي هو ببساطة تنفيذ الميزة التالية التي تحمل علامة
00:03:06"لم يتم"
00:03:06.
00:03:06يقلل هذا النهج أيضاً من ميل
00:03:08"كلود"
00:03:08إلى وضع علامة
00:03:09"مكتملة"
00:03:10على الميزات دون اختبار مناسب.
00:03:11تضمن كل تكرار بناء التطبيق بشكل كامل مع اختبار حقيقي، مما يساعد في تحديد الأخطاء التي لا تكون واضحة من التعليمات البرمجية وحدها.
00:03:19نكرر هذه الدورة حتى يتم وضع علامة "صحيح" على جميع الميزات.
00:03:22قد تعتقد أن هذا مشابه لطريقة BMAD.
00:03:24تشترك في أوجه تشابه، لكنني أعتقد أن سير عمل
00:03:27"كلود"
00:03:27أفضل من بعض النواحي.
00:03:28كان أسهل لأنك لم تستدعِ الوكلاء بشكل منفصل، واستخدام السياق كان أفضل أيضاً.
00:03:33بعد تنفيذ العديد من الميزات، استخدم 84% فقط من السياق، بينما كانت طريقة BMAD قد وصلت بالفعل إلى الضغط مرتين بسبب القصص الكبيرة التي تنشئها.
00:03:42ومع ذلك، لا يزال BMAD نظاماً كاملاً جاهزاً للاستخدام، بينما هذه لا تزال فكرة تحتاج إلى التنفيذ.
00:03:48لكن BMAD يمكن أن يستفيد من بعض الأشياء من هذا، مثل نظام Git.
00:03:51بعد تعليم ملايين الأشخاص كيفية البناء باستخدام الذكاء الاصطناعي، بدأنا في تطبيق سير العمل هذه بأنفسنا.
00:03:57اكتشفنا أنه يمكننا بناء منتجات أفضل وأسرع من أي وقت مضى.
00:04:00ساعدنا في تحويل أفكارك إلى واقع، سواء كانت تطبيقات أو مواقع ويب.
00:04:04ربما شاهدت مقاطع الفيديو الخاصة بنا وأنت تفكر:
00:04:06"لدي فكرة رائعة، لكن ليس لدي فريق تقني لبنائها."
00:04:09هذا هو بالضبط دورنا.
00:04:10فكر فينا كمساعدك التقني.
00:04:12نطبق نفس سير العمل الذي علمناه للملايين مباشرة على مشروعك، محولين المفاهيم إلى حلول حقيقية وعملية دون عناء توظيف أو إدارة فريق تطوير.
00:04:22هل أنت مستعد لتسريع تحويل فكرتك إلى واقع؟
00:04:25تواصل معنا عبر hello@autometer.dev وبهذا نصل إلى نهاية هذا الفيديو.
00:04:29إذا كنت ترغب في دعم القناة ومساعدتنا على الاستمرار في إنتاج مقاطع فيديو كهذه، يمكنك القيام بذلك باستخدام زر
00:04:35"شكر خاص"
00:04:35أدناه.
00:04:36كالعادة، شكراً لمشاهدتكم، وأراكم في الفيديو القادم.

Key Takeaway

قدمت أنثروبيك طريقة جديدة لبرمجة الكود بحدس لوكلاء الذكاء الاصطناعي، تحاكي فرق البرمجيات البشرية، لمعالجة قيود السياق وتحسين فعالية تنفيذ المهام المعقدة وطويلة الأمد.

Highlights

تطلق أنثروبيك حلاً جديداً لوكلاء الذكاء الاصطناعي لمعالجة مشكلة نافذة السياق المحدودة في المهام طويلة الأمد.

يعتمد الحل على سير عمل مستوحى من فرق هندسة البرمجيات الحقيقية، باستخدام وكيل تهيئة ووكيل برمجة يعملان بتناغم.

يتضمن سير العمل إعداد بيئة مشروع مفصلة بملفات `Claude.md` و `features.json` و `progress.md`، بالإضافة إلى ربط Puppeteer للاختبار.

يتم تنفيذ الميزات بشكل تدريجي، مع التزام Git بعد كل ميزة تم اختبارها، مما يضمن التتبع والقدرة على استئناف العمل.

يقلل هذا النهج من ميل كلود لوضع علامة "مكتملة" على الميزات دون اختبار مناسب ويحسن استخدام السياق مقارنة بالطرق الأخرى.

يمكن استئناف العمل بسهولة من أي نقطة بفضل سجلات Git وملف التقدم، مما يضمن عدم فقدان السياق أو التقدم.

Timeline

المشكلة مع وكلاء الذكاء الاصطناعي (كلود كود)

يتناول هذا القسم المشكلة الأساسية التي تواجه وكلاء الذكاء الاصطناعي مثل "كلود كود"، وهي نافذة السياق المحدودة. يوضح المتحدث كيف أن هذه القيود تجعل الوكيل ينسى الإجراءات السابقة والمهمة الرئيسية عند تكليفه بمهام أكبر، مما يقلل من فعاليته في المشاريع طويلة الأمد. يتم التركيز على أن "كلود كود" يضغط السياق عدة مرات، مما يؤدي إلى نسيان الهدف الأصلي وتنفيذ غير مكتمل. هذه المشكلة تؤثر بشكل كبير على قدرة الوكلاء على التعامل مع المهام المعقدة التي تتطلب ذاكرة طويلة الأمد.

حل أنثروبيك والأسباب الجذرية للفشل

تقدم أنثروبيك حلاً مستوحى من كيفية عمل فرق الهندسة البرمجية الحقيقية لمعالجة مشكلات وكلاء الذكاء الاصطناعي. يحدد المتحدث سببين رئيسيين لفشل الوكلاء في المهام الطويلة: الأول هو محاولة تنفيذ تطبيقات كاملة أو ميزات كبيرة دفعة واحدة، مما يستنزف سياق النموذج ويؤدي إلى تنفيذ جزئي. السبب الثاني هو ضعف قدرات الاختبار، حيث يضع "كلود" علامة "مكتملة" على الميزات غير المختبرة، حتى لو لم تعمل بشكل صحيح. هذا النهج الجديد يسعى لتجاوز هذه العقبات من خلال إعادة هيكلة طريقة عمل الوكلاء.

سير العمل المستوحى وتطبيقه

يقدم هذا الجزء الحل المقترح من أنثروبيك، وهو استخدام وكيل تهيئة ووكيل برمجة يعملان بتناغم، محاكاةً لفرق البرمجيات البشرية. يوضح المتحدث أن سير العمل هذا، على الرغم من أنه مصمم في الأصل للوكلاء الذين يتم بناؤهم ذاتياً، يمكن تطبيقه بفعالية على حالات استخدام "كلود كود" لتحسين أدائه. الفكرة الأساسية هي تقسيم المهام المعقدة إلى خطوات أصغر وأكثر قابلية للإدارة، مما يضمن معالجة كل جزء بكفاءة. هذا التناغم بين الوكيلين يهدف إلى معالجة مشكلة الذاكرة المحدودة وتحسين جودة التنفيذ.

وكيل التهيئة: إعداد البيئة

يركز هذا القسم على دور وكيل التهيئة في إعداد البيئة بشكل صحيح لوكيل البرمجة، مشدداً على أهمية الصبر في هذه المرحلة. يتم شرح الخطوات التفصيلية لإعداد المشروع، بما في ذلك إنشاء ملف `Claude.md` كوثيقة لقاعدة التعليمات البرمجية، وملف `features.json` لسرد الميزات وخطوات الاختبار (مع وضع علامة "فاشلة مبدئياً" لإجبار كلود على الاختبار). كما يتم ذكر ربط Puppeteer لاختبار المتصفح، وإنشاء نص برمجي للتهيئة، وملف `progress.md` لتتبع حالة اكتمال المشروع. يتم التأكيد على أهمية التزامات Git بسجلات واضحة تسمح بالتراجع في حالة الفشل. هذه الإعدادات تضمن أن "كلود" لديه جميع المعلومات اللازمة للعمل بشكل منهجي ومنظم.

وكيل البرمجة: التنفيذ والتكرار

يشرح هذا الجزء كيفية عمل وكيل البرمجة في تنفيذ كل ميزة على حدة من ملف `features.json`، مما يضمن معالجة منهجية للمشروع. يقوم "كلود" بإنشاء رسائل التزام وصفية بعد كل ميزة تم اختبارها، ويشغل المتصفح عند الحاجة للتحقق من عمل التطبيق بشكل فعلي. بعد التحقق، يقوم بتحديث حقول JSON من "خطأ" إلى "صحيح" وتحديث ملف `progress.md` ليعكس التقدم المحرز، ثم يثبت التغييرات. يؤكد المتحدث على أن هذا النهج التدريجي يسمح باستئناف العمل من حيث توقف بالضبط، حتى لو انتهت الجلسة، حيث يتم تتبع كل شيء في سجلات Git وملف التقدم. هذا يقلل بشكل كبير من ميل "كلود" لوضع علامة "مكتملة" على الميزات دون اختبار مناسب، مما يضمن جودة التنفيذ.

مقارنة مع طريقة BMAD والمزايا

يقارن المتحدث هذا النهج الجديد بطريقة BMAD، مشيراً إلى أوجه التشابه والاختلاف بينهما في سياق تطوير الذكاء الاصطناعي. يرى أن سير عمل "كلود" أفضل في بعض النواحي، مثل سهولة الاستخدام وعدم الحاجة لاستدعاء الوكلاء بشكل منفصل، وتحسين استخدام السياق بشكل ملحوظ. يذكر أنه بعد تنفيذ العديد من الميزات، استخدم "كلود" 84% فقط من السياق، بينما وصلت طريقة BMAD إلى الضغط مرتين بسبب القصص الكبيرة التي تنشئها. على الرغم من أن BMAD نظام كامل جاهز للاستخدام، إلا أن هذا النهج لا يزال فكرة تحتاج إلى التنفيذ العملي. ومع ذلك، يقترح المتحدث أن BMAD يمكن أن يستفيد بشكل كبير من نظام Git المطبق في هذا النهج الجديد لتحسين تتبع التقدم والتحكم في الإصدارات.

خدمة Automator.dev ودعوة للعمل

ينتقل المتحدث للحديث عن شركته، Automator.dev، وكيف تطبق هذه السير العمل المبتكرة لبناء منتجات أفضل وأسرع من أي وقت مضى. يوضح أنهم يساعدون الأفراد والشركات على تحويل أفكارهم إلى واقع ملموس، سواء كانت تطبيقات أو مواقع ويب، خاصة لأولئك الذين ليس لديهم فريق تقني خاص بهم. يقدمون أنفسهم كمساعد تقني، يطبقون نفس سير العمل الذي علموه للملايين مباشرة على مشاريع العملاء، محولين المفاهيم إلى حلول حقيقية وعملية. هذا يلغي الحاجة لتوظيف وإدارة فريق تطوير كامل، مما يوفر الوقت والجهد والموارد. يدعو المتحدث المهتمين إلى التواصل عبر hello@autometer.dev لتسريع تحويل أفكارهم المبتكرة إلى واقع ملموس.

خاتمة ودعم القناة

يختتم المتحدث الفيديو بشكر المشاهدين على متابعتهم وتقديم دعوة لدعم القناة. يشجع المشاهدين على استخدام زر "شكر خاص" المتاح أسفل الفيديو لدعم استمرار إنتاج مقاطع فيديو تعليمية ومفيدة كهذه. هذه الفقرة هي دعوة قياسية للعمل لدعم منشئ المحتوى وتختتم العرض التقديمي للموضوع الرئيسي. يؤكد المتحدث على أهمية دعم الجمهور لاستمرارية المحتوى الجيد.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video