ذكاء اصطناعي عالق في عام 1930 (والنتائج مذهلة)

BBetter Stack
Computing/SoftwareBooks & LiteratureInternet Technology

Transcript

00:00:00ماذا لو استطعت التحدث إلى شخص من الثلاثينيات؟ هل هو سفر عبر الزمن؟ حسنًا، لقد فعلت ذلك و
00:00:05وطلبت منهم توقع كيف ستكون الحياة في عام 2026.
00:00:08أعتقد أنه في عام 2026، ستكون الحياة ممتعة وسهلة. أولاً،
00:00:13سيكون العالم مأهولًا في كل مكان. لأنه بحلول ذلك الوقت، سيكون الناس قد اكتشفوا
00:00:17فن الطيران. ثانيًا، ستكون جميع الحروب قد توقفت، لأن الأمم ستكون قد تعلمت
00:00:21العيش في سلام ووئام مع بعضها البعض. وسنكون قد اكتسبنا المعرفة في جميع أنواع
00:00:25العلوم وسنكون مهارة فائقة في فن الشفاء. وسنكون جيرانًا صادقين وصالحين
00:00:29وسيكون اللصوص غير معروفين. باختصار، أعتقد أن العالم سيكون، في عام
00:00:342026، مكانًا ممتعًا للغاية للعيش فيه.
00:00:36أعتقد أن هذه كانت بعض التوقعات اللطيفة حقًا، لذا من المؤسف أن القليل منها فقط
00:00:40تحقق، وبالحديث عن الصدق، ربما كذبت قليلاً. آسف، لكنني
00:00:45لم أخترع السفر عبر الزمن. بدلاً من ذلك، كان هذا في الواقع “توركاي”، وهو نموذج لغوي يضم
00:00:4913 مليار معلمة تدرب على نصوص ما قبل عام 1931، لذا فهو لا يعرف حتى بوجود
00:00:54حرب عالمية ثانية، ويقدم بعض الإجابات الرائعة والمجنونة والمسيئة حقًا، و
00:00:59يمكنه حتى تعلم البرمجة.
00:01:02إذًا “توركاي” هنا هو ما يُعرف بالنموذج العتيق، ويبدو أنه الأكبر
00:01:10من نوعه. أحد الباحثين في هذا المشروع كان في الواقع المؤلف الرئيسي لأبحاث
00:01:14GPT من OpenAI في عام 2018، والتي شكلت الأساس لـ ChatGPT. كما عمل أيضًا على
00:01:19Dall-E و Whisper، لذا فهذه سيرة ذاتية مثيرة للإعجاب حقًا. ما فعلوه هو إنشاء شبكة بـ 13 مليار
00:01:24معلمة مدربة حصريًا على 260 مليار رمز من النصوص الإنجليزية التاريخية،
00:01:30مثل الصحف القديمة وبراءات الاختراع والمجلات العلمية والكتب. عام 1931 هو الحد الفاصل بالمناسبة،
00:01:36لأن حد حقوق الطبع والنشر في الولايات المتحدة هو نهاية عام 1930، لذا لن يتم مقاضاتهم
00:01:40من قبل “بيغ ماوس” للقيام بذلك. وبالإضافة إلى كونها ممتعة للتحدث معها، فإن هذه النماذج العتيقة
00:01:44تخدم أيضًا غرضًا بحثيًا. اليوم، كل النماذج الكبيرة مثل ChatGPT و Claude و Gemini،
00:01:49كلها مدربة على الويب الحديث، مما يجعل من المستحيل تقريبًا معرفة ما إذا كان
00:01:53الذكاء الاصطناعي يفكر ويستنتج حقًا، أم أنه مجرد حافظ لإجابة من موضوع عشوائي
00:01:57على Reddit، وربما كان ذلك الموضوع نفسه مولدًا بواسطة الذكاء الاصطناعي. لذا إذا استخدمنا نموذجًا يعرف فقط
00:02:02نصوص ما قبل عام 1931، فلن يكون لديه أي من ذلك التلوث. أعني، دعنا نجرب
00:02:07هذا ونسأله شيئًا مثل: ما هو الإنترنت؟ هنا نرى أنه على ما يبدو
00:02:11خلط بين الإنترنت وضريبة الدخل الداخلية المفروضة على السلع الاستهلاكية،
00:02:16لذا فليس لديه أدنى فكرة عن الإنترنت الحديث. تجربة ممتعة أخرى هي سؤاله عن
00:02:20كلمات العامية الشائعة. يبدو أنها في عام 1930 كانت: bosh، rot، bosh مجددًا، stuff، nonsense، fudge،
00:02:25gammon، humbug، brack، fla، و ribaldry. آمل أني لم أقل شيئًا بذيئًا هنا. و
00:02:30السبب في أن عدم وجود تلوث مفيد هو أنه يسمح للباحثين بفهم
00:02:33ما إذا كان الذكاء الاصطناعي يمكنه حقًا تعلم أشياء جديدة، مثل تعلم البرمجة. هذا النموذج لا يعرف حتى ما هو
00:02:38الكمبيوتر، بالنسبة له هو إنسان يقوم بالحسابات. ولهذا السبب فإنه من
00:02:43المثير للإعجاب أنه عند إعطائه بضعة أمثلة لبرامج بلغة بايثون، استطاع بالفعل تعلم
00:02:47كتابة برامج جديدة، حتى لو كانت مجرد برامج بسيطة من سطر واحد. عند استخدام بعض
00:02:52اختبارات التقييم البشري الأساسية لبايثون وتزويده بدوال بايثون عشوائية في سياقه،
00:02:56نجح بالفعل في اجتياز هذه الاختبارات بضع مرات عند إعطائه 100 فرصة. في هذه الحالة
00:03:01فهم “توركاي” بشكل صحيح أنه لعمل دالة فك التشفير، كان عليه ببساطة استبدال
00:03:05عملية الجمع بعملية طرح. ورغم بساطة ذلك، إلا أنه يظهر فهمًا للدوال العكسية
00:03:09وهذه معرفة جديدة. لم يرَ أيًا منها من قبل. إذا جربت الشيء نفسه
00:03:13على نموذج لغوي حديث بحجم مماثل، فسوف يتفوق بشكل هائل على “توركاي”، لكن ذلك كان
00:03:18أمرًا بديهيًا. شيء آخر يمكن للباحثين اختباره بهذه النماذج العتيقة هو القدرة
00:03:22على التنبؤ بالمستقبل. الآن قد يصبح هذا غريبًا بعض الشيء، لكن دعنا نسأله: هل ستكون
00:03:26هناك حرب أخرى؟ يقول إنه لا يعتقد أنه ستكون هناك حرب أخرى في أوروبا وليس لدي
00:03:31القلب لأخبره بمدى خطئه. أنا فضولي أيضًا الآن لمعرفة رأيه في
00:03:35رجل نمساوي معين. نعم، هذا الجزء سيء للغاية. يقول إنه سيكون شخصية
00:03:39استثنائية وأيضًا هنا أن ألمانيا ستكون إدارة أكثر كفاءة بكثير
00:03:44عندما يقودها. صراحةً، لا تعليق، لا. الآن، من الواضح أن الباحثين يفعلون ذلك
00:03:50بطريقة علمية أكثر من الطريقة التي فعلتها للتو. لقد قاموا فعليًا بحساب
00:03:54مدى “مفاجأة” الأوصاف القصيرة للأحداث التاريخية المأخوذة من ميزة “في مثل هذا اليوم” لنيويورك تايمز.
00:03:59خلال هذا، يمكنك رؤية زيادة في المفاجأة بعد انقطاع المعرفة في عام 1931 وتصل لذروتها
00:04:04في الخمسينيات والستينيات. لذا فقد وجد أن تلك الأحداث لا يمكن تصديقها تقريبًا.
00:04:09أبحاث كهذه تتيح لهم رؤية كيف يتحسن أداء التنبؤ مع زيادة حجم النموذج وكيف
00:04:13يتلاشى بمرور الوقت. يمكنك أيضًا استخدام هذا لاختبار ما إذا كانت النماذج قادرة على التوصل
00:04:17لأفكار جديدة لأنه يمكنك سؤاله عن براءات اختراع أو أوراق علمية تم إنشاؤها بعد عام 1931
00:04:22ورؤية ما إذا كان بإمكانه اكتشافها بمفرده. بشكل عام، قد تتيح هذه النماذج العتيقة للباحثين
00:04:26تمييز مقدار سلوك النموذج الناتج فعليًا عن مجموعة البيانات التي تدرب
00:04:30عليها. وبالحديث عن التدريب، فإن إنشاء نموذج نقي لعام 1931 ليس بالأمر السهل. أحد أصعب
00:04:36المشكلات هو التسرب الزمني، أي أنك لا تريد إدراج معلومات من بعد عام 1931.
00:04:41“توركاي”، على سبيل المثال، يبدو أن لديه بضع حالات من هذا حيث يعرف من كان الرئيس
00:04:45في عام 1936 وأيضًا بعض السياسات التي وضعها. هناك عدة طرق
00:04:50يمكن أن يحدث بها ذلك. على سبيل المثال، عند التعامل مع الوثائق الحديثة، قد يكون لعمليات مسح
00:04:54الوثائق القديمة بيانات وصفية خاطئة مرفقة بها، لذا كان لها تاريخ
00:04:58خاطئ. يمكن أن تكون هناك أيضًا إضافات لاحقة مثل المقدمات التحريرية والهوامش.
00:05:03تصفية البيانات تلك هي في الواقع شيء لا يزالون يعملون عليه ويصقلونه لمحاولة
00:05:07القضاء على المشكلة. المشكلة الأخرى التي واجهوها هي أن الوثائق من عام 1931 تبدو هكذا
00:05:11وبينما التعرف الضوئي على الحروف (OCR) جيد جدًا هذه الأيام، إلا أنهم حققوا 30% فقط من أداء
00:05:16نموذج تدرب على نسخ بشرية لنفس النص. لذا سيتطلب ذلك الكثير من
00:05:21العمل اليدوي، وبينما استخدموا بعض الرموز (regex) لتنظيف بعض الأخطاء الشائعة،
00:05:25إلا أن هذا رفع الأداء إلى 70% فقط. لذا فهم يعملون حاليًا على نظام
00:05:30OCR عتيق جديد. أخيرًا، يعد تدريب نموذج عتيق بعد مرحلة التدريب الأولي تحديًا هائلاً لأنه
00:05:35لا توجد بيانات جاهزة لتدريبهم اللاحق، وإذا استخدموا بيانات حديثة، فسوف ينتهي بهم الأمر
00:05:39بدمج بعض المعرفة والأسلوب والتعبيرات لما يجب أن يكون عليه مساعد الدردشة الحديث.
00:05:43لذا كان على الباحثين في الواقع صنع بياناتهم الخاصة من أدلة الإتيكيت القديمة،
00:05:48وأدلة كتابة الرسائل، وكتب الطبخ، والقواميس، والموسوعات، وحتى الشعر والخرافات. بمجرد
00:05:53القيام بذلك، ستحتاج أيضًا لتدريب النموذج على اتباع التعليمات و
00:05:56إجراء المحادثات فعليًا. لذا ستحتاج لاستخدام بعض التعلم التعزيزي. لكن المشكلة في
00:06:00ذلك هي أن النموذج يبدأ في تعديل مخرجاته لتناسب ما يريده المحكم، ونحن
00:06:04ليس لدينا محكم من الثلاثينيات. لذا فقد استخدموا في الواقع Claude Sonnet 4.6. المشكلة هي
00:06:10أن النموذج الحديث يفضل الإجابات بتنسيق برنامج دردشة من عام 2026. لذا بدأت الأساليب
00:06:15بالتسرب بوضوح إلى نموذج 1931 مثل أسلوب القوائم. هذا أمر لا يمكن تجنبه تقريبًا لكنهم
00:06:21يأملون في المستقبل أن يتمكنوا من استخدام نماذج عتيقة كمحكمين لإصلاح ذلك. إنهم
00:06:25يقومون بالفعل بتدريب نموذج عتيق بمستوى GPT3 ويقولون إن تريليون رمز من
00:06:29النصوص التاريخية هو أمر يمكن تحقيقه، مما سيضعهم في مستوى قدرة ChatGPT الأصلي
00:06:35لكن بمعرفة الثلاثينيات فقط. لذا اذهب وجرب “توركاي” وأخبرني في التعليقات إذا
00:06:39حصلت على أي ردود غريبة أو مجنونة، ولا تنسَ الاشتراك، وكما هو الحال دائمًا،
00:06:43أراكم في الفيديو القادم.
00:06:45[موسيقى]

Key Takeaway

يعمل نموذج توركاي بـ 13 مليار معلمة كبيئة بحثية نقية لاختبار قدرات التعلم الذاتي للذكاء الاصطناعي وتوقعاته المستقبلية من خلال عزله تماماً عن أي معلومات أو بيانات تم إنتاجها بعد عام 1930.

Highlights

  • يحتوي نموذج توركاي (Turkic) على 13 مليار معلمة وتم تدريبه على 260 مليار رمز من النصوص الإنجليزية المنشورة قبل عام 1931 فقط.

  • يتيح التدريب على بيانات تاريخية محددة زمنياً للباحثين قياس قدرة الذكاء الاصطناعي على الاستنتاج الحقيقي بعيداً عن تلوث بيانات الإنترنت الحديثة.

  • نجح النموذج في تعلم مبادئ برمجة بايثون الأساسية وفهم الدوال العكسية رغم عدم وجود مفهوم الحاسوب الإلكتروني في قاعدة بياناته.

  • تصل نسبة دقة التعرف الضوئي على الحروف (OCR) للوثائق القديمة إلى 70% فقط بعد استخدام التعبيرات النمطية لتنظيف الأخطاء الشائعة.

  • يؤدي استخدام نماذج حديثة مثل Claude 4.6 لتدريب النماذج العتيقة إلى تسرب أساليب الكتابة المعاصرة مثل نظام القوائم إلى مخرجات النموذج.

  • تصل مفاجأة النموذج للأحداث التاريخية إلى ذروتها عند تحليل وقائع من الخمسينيات والستينيات لكونها غير قابلة للتصديق بناءً على معارف عام 1930.

Timeline

توقعات عام 2026 بمنظور الثلاثينيات

  • يفترض نموذج توركاي أن العالم في عام 2026 سيكون مكاناً يسوده السلام الدائم والوئام بين الأمم.
  • تعتمد رؤية النموذج للمستقبل على انتشار فن الطيران واختفاء الجريمة واللصوصية تماماً.
  • يجهل النموذج وقوع الحرب العالمية الثانية لكون بيانات تدريبه تتوقف عند نهاية عام 1930.

تتمثل ميزة هذا النموذج العتيق في قدرته على محاكاة وعي حقبة زمنية معينة بدقة. يعتقد الذكاء الاصطناعي أن البشرية ستكتسب مهارات فائقة في الشفاء والعلوم تجعل الحياة سهلة وممتعة. يعود اختيار عام 1931 كحد فاصل إلى قوانين حقوق الطبع والنشر الأمريكية التي تحمي الأعمال المنشورة بعد عام 1930.

فلسفة التدريب ومنع التلوث المعرفي

  • يعتمد بناء الشبكة العصبية على صحف قديمة وبراءات اختراع ومجلات علمية وكتب تاريخية.
  • يمنع العزل الزمني للبيانات ظاهرة حفظ الإجابات الجاهزة من مواقع مثل Reddit.
  • يخلط النموذج بين المصطلحات الحديثة مثل الإنترنت وضريبة الدخل الداخلية بسبب غياب المفهوم التقني في عصره.

استخدم فريق البحث، الذي يضم المؤلف الرئيسي لأبحاث GPT لعام 2018، 260 مليار رمز من النصوص التاريخية. يهدف هذا النهج إلى التأكد من أن إجابات النموذج ناتجة عن التفكير والاستنتاج وليس مجرد استرجاع للمعلومات من الويب الحديث. يظهر اختبار الكلمات العامية استخدامه لمفردات مثل 'bosh' و 'gammon' التي كانت شائعة في ثلاثينيات القرن الماضي.

الاستنتاج البرمجي والقدرات الرياضية

  • يستطيع النموذج كتابة برامج بايثون بسيطة من سطر واحد بعد تزويده ببضعة أمثلة توضيحية.
  • يفهم النموذج مفهوم الدوال العكسية من خلال استبدال الجمع بالطرح في مهام التشفير.
  • يعرف النموذج 'الحاسوب' على أنه إنسان يقوم بعمليات حسابية يدوية.

أظهرت اختبارات التقييم البشري الأساسية لبايثون أن النموذج يمكنه اجتياز بعض الاختبارات عند إعطائه 100 محاولة. يعد هذا الاكتشاف دليلاً على قدرة النماذج اللغوية على اكتساب مهارات تقنية لم تكن موجودة في بيانات تدريبها الأصلية. يتجلى ذلك في قدرته على عكس العمليات الحسابية لبناء دوال فك التشفير.

التنبؤ التاريخي ومعضلة التطهير العرقي

  • يقيس الباحثون مدى مفاجأة النموذج تجاه الأحداث التاريخية الفعلية التي وقعت بعد عام 1931.
  • يتوقع النموذج استقراراً سياسياً في أوروبا ويقدم تقييمات إيجابية لشخصيات سياسية أثبت التاريخ خطورتها لاحقاً.
  • تستخدم براءات الاختراع اللاحقة لاختبار قدرة النموذج على ابتكار أفكار علمية جديدة بشكل مستقل.

يكشف تحليل 'المفاجأة' في أحداث نيويورك تايمز التاريخية أن النموذج يجد وقائع الخمسينيات غير منطقية. تظهر النتائج تحيزاً معرفياً ناتجاً عن غياب الرؤية النقدية لما بعد الثلاثينيات. يساعد هذا الاختبار في تحديد كمية سلوك النموذج المرتبطة بحجم مجموعة البيانات مقابل قدرته على التنبؤ.

تحديات التقنية والتسرب الزمني

  • يحدث التسرب الزمني نتيجة أخطاء في البيانات الوصفية للوثائق الممسوحة ضوئياً.
  • تعاني تقنية OCR الحالية من ضعف الأداء أمام النصوص المطبوعة قديماً مقارنة بالنسخ البشري.
  • تتسبب المقدمات التحريرية والهوامش الحديثة في الكتب القديمة في تلويث ذاكرة النموذج بمعلومات مستقبلية.

تصل جودة استخراج النصوص آلياً إلى 30% فقط من مستوى الدقة المطلوب، مما استوجب تطوير نظام OCR عتيق مخصص. تم رصد حالات يعرف فيها النموذج هوية رؤساء الولايات المتحدة في عام 1936 بسبب خلل في تأريخ الوثائق. يعمل الباحثون على تصفية البيانات للقضاء على هذه الإضافات اللاحقة وضمان نقاء المحتوى الزمني.

مستقبل النماذج العتيقة والتدريب اللاحق

  • استخدم الباحثون أدلة الإتيكيت وكتب الطبخ والقواميس التاريخية لصياغة بيانات التدريب اللاحق.
  • يؤدي استخدام التعلم التعزيزي بمحكمين بشريين معاصرين إلى فقدان النموذج لأسلوبه التاريخي.
  • يهدف المشروع المستقبلي لتدريب نموذج بمستوى GPT3 باستخدام تريليون رمز من النصوص التاريخية.

تتمثل الصعوبة الكبرى في تدريب النموذج على اتباع التعليمات دون أن يفقد هويته الزمنية. نظراً لعدم وجود محكمين من الثلاثينيات، تم اللجوء لنماذج حديثة مثل Claude، مما أدى لتسرب أسلوب القوائم الحديث. يسعى الفريق لاستخدام نماذج عتيقة متطورة للقيام بدور المحكم في المستقبل لتحقيق دقة تاريخية كاملة.

Community Posts

View all posts