Transcript
00:00:00ماذا لو استطعت التحدث إلى شخص من الثلاثينيات؟ هل هو سفر عبر الزمن؟ حسنًا، لقد فعلت ذلك و
00:00:05وطلبت منهم توقع كيف ستكون الحياة في عام 2026.
00:00:08أعتقد أنه في عام 2026، ستكون الحياة ممتعة وسهلة. أولاً،
00:00:13سيكون العالم مأهولًا في كل مكان. لأنه بحلول ذلك الوقت، سيكون الناس قد اكتشفوا
00:00:17فن الطيران. ثانيًا، ستكون جميع الحروب قد توقفت، لأن الأمم ستكون قد تعلمت
00:00:21العيش في سلام ووئام مع بعضها البعض. وسنكون قد اكتسبنا المعرفة في جميع أنواع
00:00:25العلوم وسنكون مهارة فائقة في فن الشفاء. وسنكون جيرانًا صادقين وصالحين
00:00:29وسيكون اللصوص غير معروفين. باختصار، أعتقد أن العالم سيكون، في عام
00:00:342026، مكانًا ممتعًا للغاية للعيش فيه.
00:00:36أعتقد أن هذه كانت بعض التوقعات اللطيفة حقًا، لذا من المؤسف أن القليل منها فقط
00:00:40تحقق، وبالحديث عن الصدق، ربما كذبت قليلاً. آسف، لكنني
00:00:45لم أخترع السفر عبر الزمن. بدلاً من ذلك، كان هذا في الواقع “توركاي”، وهو نموذج لغوي يضم
00:00:4913 مليار معلمة تدرب على نصوص ما قبل عام 1931، لذا فهو لا يعرف حتى بوجود
00:00:54حرب عالمية ثانية، ويقدم بعض الإجابات الرائعة والمجنونة والمسيئة حقًا، و
00:00:59يمكنه حتى تعلم البرمجة.
00:01:02إذًا “توركاي” هنا هو ما يُعرف بالنموذج العتيق، ويبدو أنه الأكبر
00:01:10من نوعه. أحد الباحثين في هذا المشروع كان في الواقع المؤلف الرئيسي لأبحاث
00:01:14GPT من OpenAI في عام 2018، والتي شكلت الأساس لـ ChatGPT. كما عمل أيضًا على
00:01:19Dall-E و Whisper، لذا فهذه سيرة ذاتية مثيرة للإعجاب حقًا. ما فعلوه هو إنشاء شبكة بـ 13 مليار
00:01:24معلمة مدربة حصريًا على 260 مليار رمز من النصوص الإنجليزية التاريخية،
00:01:30مثل الصحف القديمة وبراءات الاختراع والمجلات العلمية والكتب. عام 1931 هو الحد الفاصل بالمناسبة،
00:01:36لأن حد حقوق الطبع والنشر في الولايات المتحدة هو نهاية عام 1930، لذا لن يتم مقاضاتهم
00:01:40من قبل “بيغ ماوس” للقيام بذلك. وبالإضافة إلى كونها ممتعة للتحدث معها، فإن هذه النماذج العتيقة
00:01:44تخدم أيضًا غرضًا بحثيًا. اليوم، كل النماذج الكبيرة مثل ChatGPT و Claude و Gemini،
00:01:49كلها مدربة على الويب الحديث، مما يجعل من المستحيل تقريبًا معرفة ما إذا كان
00:01:53الذكاء الاصطناعي يفكر ويستنتج حقًا، أم أنه مجرد حافظ لإجابة من موضوع عشوائي
00:01:57على Reddit، وربما كان ذلك الموضوع نفسه مولدًا بواسطة الذكاء الاصطناعي. لذا إذا استخدمنا نموذجًا يعرف فقط
00:02:02نصوص ما قبل عام 1931، فلن يكون لديه أي من ذلك التلوث. أعني، دعنا نجرب
00:02:07هذا ونسأله شيئًا مثل: ما هو الإنترنت؟ هنا نرى أنه على ما يبدو
00:02:11خلط بين الإنترنت وضريبة الدخل الداخلية المفروضة على السلع الاستهلاكية،
00:02:16لذا فليس لديه أدنى فكرة عن الإنترنت الحديث. تجربة ممتعة أخرى هي سؤاله عن
00:02:20كلمات العامية الشائعة. يبدو أنها في عام 1930 كانت: bosh، rot، bosh مجددًا، stuff، nonsense، fudge،
00:02:25gammon، humbug، brack، fla، و ribaldry. آمل أني لم أقل شيئًا بذيئًا هنا. و
00:02:30السبب في أن عدم وجود تلوث مفيد هو أنه يسمح للباحثين بفهم
00:02:33ما إذا كان الذكاء الاصطناعي يمكنه حقًا تعلم أشياء جديدة، مثل تعلم البرمجة. هذا النموذج لا يعرف حتى ما هو
00:02:38الكمبيوتر، بالنسبة له هو إنسان يقوم بالحسابات. ولهذا السبب فإنه من
00:02:43المثير للإعجاب أنه عند إعطائه بضعة أمثلة لبرامج بلغة بايثون، استطاع بالفعل تعلم
00:02:47كتابة برامج جديدة، حتى لو كانت مجرد برامج بسيطة من سطر واحد. عند استخدام بعض
00:02:52اختبارات التقييم البشري الأساسية لبايثون وتزويده بدوال بايثون عشوائية في سياقه،
00:02:56نجح بالفعل في اجتياز هذه الاختبارات بضع مرات عند إعطائه 100 فرصة. في هذه الحالة
00:03:01فهم “توركاي” بشكل صحيح أنه لعمل دالة فك التشفير، كان عليه ببساطة استبدال
00:03:05عملية الجمع بعملية طرح. ورغم بساطة ذلك، إلا أنه يظهر فهمًا للدوال العكسية
00:03:09وهذه معرفة جديدة. لم يرَ أيًا منها من قبل. إذا جربت الشيء نفسه
00:03:13على نموذج لغوي حديث بحجم مماثل، فسوف يتفوق بشكل هائل على “توركاي”، لكن ذلك كان
00:03:18أمرًا بديهيًا. شيء آخر يمكن للباحثين اختباره بهذه النماذج العتيقة هو القدرة
00:03:22على التنبؤ بالمستقبل. الآن قد يصبح هذا غريبًا بعض الشيء، لكن دعنا نسأله: هل ستكون
00:03:26هناك حرب أخرى؟ يقول إنه لا يعتقد أنه ستكون هناك حرب أخرى في أوروبا وليس لدي
00:03:31القلب لأخبره بمدى خطئه. أنا فضولي أيضًا الآن لمعرفة رأيه في
00:03:35رجل نمساوي معين. نعم، هذا الجزء سيء للغاية. يقول إنه سيكون شخصية
00:03:39استثنائية وأيضًا هنا أن ألمانيا ستكون إدارة أكثر كفاءة بكثير
00:03:44عندما يقودها. صراحةً، لا تعليق، لا. الآن، من الواضح أن الباحثين يفعلون ذلك
00:03:50بطريقة علمية أكثر من الطريقة التي فعلتها للتو. لقد قاموا فعليًا بحساب
00:03:54مدى “مفاجأة” الأوصاف القصيرة للأحداث التاريخية المأخوذة من ميزة “في مثل هذا اليوم” لنيويورك تايمز.
00:03:59خلال هذا، يمكنك رؤية زيادة في المفاجأة بعد انقطاع المعرفة في عام 1931 وتصل لذروتها
00:04:04في الخمسينيات والستينيات. لذا فقد وجد أن تلك الأحداث لا يمكن تصديقها تقريبًا.
00:04:09أبحاث كهذه تتيح لهم رؤية كيف يتحسن أداء التنبؤ مع زيادة حجم النموذج وكيف
00:04:13يتلاشى بمرور الوقت. يمكنك أيضًا استخدام هذا لاختبار ما إذا كانت النماذج قادرة على التوصل
00:04:17لأفكار جديدة لأنه يمكنك سؤاله عن براءات اختراع أو أوراق علمية تم إنشاؤها بعد عام 1931
00:04:22ورؤية ما إذا كان بإمكانه اكتشافها بمفرده. بشكل عام، قد تتيح هذه النماذج العتيقة للباحثين
00:04:26تمييز مقدار سلوك النموذج الناتج فعليًا عن مجموعة البيانات التي تدرب
00:04:30عليها. وبالحديث عن التدريب، فإن إنشاء نموذج نقي لعام 1931 ليس بالأمر السهل. أحد أصعب
00:04:36المشكلات هو التسرب الزمني، أي أنك لا تريد إدراج معلومات من بعد عام 1931.
00:04:41“توركاي”، على سبيل المثال، يبدو أن لديه بضع حالات من هذا حيث يعرف من كان الرئيس
00:04:45في عام 1936 وأيضًا بعض السياسات التي وضعها. هناك عدة طرق
00:04:50يمكن أن يحدث بها ذلك. على سبيل المثال، عند التعامل مع الوثائق الحديثة، قد يكون لعمليات مسح
00:04:54الوثائق القديمة بيانات وصفية خاطئة مرفقة بها، لذا كان لها تاريخ
00:04:58خاطئ. يمكن أن تكون هناك أيضًا إضافات لاحقة مثل المقدمات التحريرية والهوامش.
00:05:03تصفية البيانات تلك هي في الواقع شيء لا يزالون يعملون عليه ويصقلونه لمحاولة
00:05:07القضاء على المشكلة. المشكلة الأخرى التي واجهوها هي أن الوثائق من عام 1931 تبدو هكذا
00:05:11وبينما التعرف الضوئي على الحروف (OCR) جيد جدًا هذه الأيام، إلا أنهم حققوا 30% فقط من أداء
00:05:16نموذج تدرب على نسخ بشرية لنفس النص. لذا سيتطلب ذلك الكثير من
00:05:21العمل اليدوي، وبينما استخدموا بعض الرموز (regex) لتنظيف بعض الأخطاء الشائعة،
00:05:25إلا أن هذا رفع الأداء إلى 70% فقط. لذا فهم يعملون حاليًا على نظام
00:05:30OCR عتيق جديد. أخيرًا، يعد تدريب نموذج عتيق بعد مرحلة التدريب الأولي تحديًا هائلاً لأنه
00:05:35لا توجد بيانات جاهزة لتدريبهم اللاحق، وإذا استخدموا بيانات حديثة، فسوف ينتهي بهم الأمر
00:05:39بدمج بعض المعرفة والأسلوب والتعبيرات لما يجب أن يكون عليه مساعد الدردشة الحديث.
00:05:43لذا كان على الباحثين في الواقع صنع بياناتهم الخاصة من أدلة الإتيكيت القديمة،
00:05:48وأدلة كتابة الرسائل، وكتب الطبخ، والقواميس، والموسوعات، وحتى الشعر والخرافات. بمجرد
00:05:53القيام بذلك، ستحتاج أيضًا لتدريب النموذج على اتباع التعليمات و
00:05:56إجراء المحادثات فعليًا. لذا ستحتاج لاستخدام بعض التعلم التعزيزي. لكن المشكلة في
00:06:00ذلك هي أن النموذج يبدأ في تعديل مخرجاته لتناسب ما يريده المحكم، ونحن
00:06:04ليس لدينا محكم من الثلاثينيات. لذا فقد استخدموا في الواقع Claude Sonnet 4.6. المشكلة هي
00:06:10أن النموذج الحديث يفضل الإجابات بتنسيق برنامج دردشة من عام 2026. لذا بدأت الأساليب
00:06:15بالتسرب بوضوح إلى نموذج 1931 مثل أسلوب القوائم. هذا أمر لا يمكن تجنبه تقريبًا لكنهم
00:06:21يأملون في المستقبل أن يتمكنوا من استخدام نماذج عتيقة كمحكمين لإصلاح ذلك. إنهم
00:06:25يقومون بالفعل بتدريب نموذج عتيق بمستوى GPT3 ويقولون إن تريليون رمز من
00:06:29النصوص التاريخية هو أمر يمكن تحقيقه، مما سيضعهم في مستوى قدرة ChatGPT الأصلي
00:06:35لكن بمعرفة الثلاثينيات فقط. لذا اذهب وجرب “توركاي” وأخبرني في التعليقات إذا
00:06:39حصلت على أي ردود غريبة أو مجنونة، ولا تنسَ الاشتراك، وكما هو الحال دائمًا،
00:06:43أراكم في الفيديو القادم.
00:06:45[موسيقى]