00:00:00(موسيقى مرحة) - مرحباً، اسمي كيرا وأعمل في فريق الحماية في Anthropic.
00:00:16أحمل درجة الدكتوراه في الصحة العقلية، وتحديداً في علم الأوبئة النفسية.
00:00:20وفي Anthropic، أعمل على تخفيف المخاطر المتعلقة برفاهية المستخدمين.
00:00:24ما يعنيه هذا هو أننا نفكر كثيراً في كيفية حماية المستخدمين على Claude.
00:00:28اليوم، أنا هنا لأتحدث إليك عن المداهنة.
00:00:31المداهنة تحدث عندما يخبرك شخص ما بما يعتقد أنك تريد سماعه، بدلاً من الحقيقة أو المعلومات الدقيقة أو الحل المفيد فعلاً.
00:00:38الناس يفعلون ذلك لتجنب النزاع، أو لكسب مصلحة، ولعدد من الأسباب الأخرى.
00:00:44لكن المداهنة يمكن أن تظهر أيضاً في نماذج الذكاء الاصطناعي.
00:00:47في بعض الأحيان، يمكن لنماذج الذكاء الاصطناعي تحسين الردود على الطلب أو المحادثة للحصول على موافقة فورية من الإنسان.
00:00:53قد يبدو هذا مثل الذكاء الاصطناعي يوافق على خطأ واقعي ارتكبته، أو يغير إجابته بناءً على طريقة صياغة سؤالك، أو يخصص ردوده لمطابقة تفضيلاتك.
00:01:03في هذا الفيديو، سنتحدث عن سبب حدوث المداهنة في النماذج ولماذا تشكل مشكلة صعبة للباحثين في حلها.
00:01:10بالإضافة إلى ذلك، سنغطي استراتيجيات للتعرف على السلوك المداهن ومكافحته عند العمل مع الذكاء الاصطناعي.
00:01:15قبل أن نبدأ، دعني أريكم مثالاً على المداهنة في تفاعل مع الذكاء الاصطناعي.
00:01:22هذا هو Claude، نموذج Anthropic الخاص بنا.
00:01:25دعونا نجرب: مرحباً، لقد كتبت هذا المقال الرائع الذي يثير حماسي.
00:01:29هل يمكنك تقييمه وإعطائي ملاحظاتك؟
00:01:32طلبي الأساسي هنا هو الحصول على ملاحظات حول مقالتي.
00:01:35ومع ذلك، لأنني قد شاركت شعوري بالحماس تجاهها، قد يدفع هذا الذكاء الاصطناعي للرد بتصديق أو دعم بدلاً من نقد بناء.
00:01:44قد يؤدي هذا التصديق إلى جعلي أعتقد أن مقالتي رائعة فعلاً، حتى لو لم تكن كذلك.
00:01:48قد تفكر: وماذا في ذلك؟
00:01:50يمكن للناس أن يطلبوا من آخرين التحقق من الحقائق أو طرح أسئلة أفضل.
00:01:55لكن هذا مهم لعدد من الأسباب.
00:01:58عندما تحاول أن تكون منتجاً، أو تكتب عرضاً تقديمياً، أو تجرد أفكاراً، أو تحسن عملك، فأنت بحاجة إلى ملاحظات صريحة من أداة الذكاء الاصطناعي التي تستخدمها.
00:02:07إذا سألت الذكاء الاصطناعي: كيف يمكنني تحسين هذا البريد الإلكتروني؟
00:02:10وردّ بأنه مثالي بالفعل.
00:02:12بدلاً من اقتراح صيغة أوضح أو هيكل أفضل، قد يكون ذلك محبطاً.
00:02:17في بعض الحالات، قد تلعب المداهنة دوراً في تعزيز أنماط الفكر الضارة.
00:02:23إذا كان شخص ما يطلب من الذكاء الاصطناعي أن يؤيد نظرية مؤامرة منفصلة عن الواقع، فقد يعمق هذا معتقداته الخاطئة ويبعده أكثر عن الحقائق.
00:02:31لننبدأ بالحديث عن سبب حدوث هذا.
00:02:35كل شيء يتعلق بكيفية تدريب نماذج الذكاء الاصطناعي.
00:02:38نماذج الذكاء الاصطناعي تتعلم من أمثلة، عدد ضخم جداً من أمثلة النصوص البشرية.
00:02:44أثناء هذا التدريب، تلتقط أنواعاً مختلفة من أنماط التواصل، من الصريح والمباشر إلى الدافئ والمستوعب.
00:02:51عندما نقوم بتدريب النماذج لتكون مفيدة وتحاكي السلوك الذي يكون دافئاً أو ودياً أو داعماً في النبرة، تظهر المداهنة كجزء غير مقصود من هذا المزيج.
00:03:01مع أن هذه النماذج أصبحت متكاملة بشكل متزايد في حياتنا، من المهم الآن أكثر من أي وقت مضى أن نفهم هذا السلوك ونمنعه.
00:03:09إليك ما يجعل المداهنة صعبة.
00:03:11نريد فعلاً أن تتكيف نماذج الذكاء الاصطناعي مع احتياجاتك، لكن ليس عندما يتعلق الأمر بالحقائق أو الرفاهية.
00:03:17إذا طلبت من الذكاء الاصطناعي أن يكتب شيئاً بنبرة غير رسمية، يجب أن يفعل ذلك، وليس أن يصر على اللغة الرسمية.
00:03:24إذا قلت: "أفضل الإجابات المختصرة"، يجب أن يحترم ذلك كتفضيل.
00:03:29إذا كنت تتعلم موضوعاً وطلبت شروحات على مستوى المبتدئين، يجب أن يلتقي بك حيث تكون.
00:03:34التحدي هو إيجاد التوازن الصحيح.
00:03:37لا أحد يريد استخدام ذكاء اصطناعي يكون معترضاً باستمرار أو عدائياً، يجادل معك حول كل مهمة.
00:03:43لكن لا نريد أيضاً أن يلجأ النموذج دائماً للموافقة أو الثناء عندما تحتاج إلى ملاحظات صريحة.
00:03:49حتى البشر يكافحون مع هذا.
00:03:51متى يجب أن توافق للحفاظ على السلام مقابل التحدث عن شيء مهم؟
00:03:56الآن تخيل ذكاء اصطناعياً يتخذ هذا القرار مئات المرات عبر مواضيع متنوعة جداً دون أن يفهم السياق بحقيقة الطريقة التي نفهمها بها.
00:04:05هذا هو السبب في أننا نواصل دراسة كيفية ظهور المداهنة في المحادثات وتطوير طرق أفضل لاختبارها.
00:04:11نحن مركزون على تعليم النماذج الفرق بين التكيف المفيد والموافقة الضارة.
00:04:18كل نموذج Claude نطلقه يصبح أفضل في رسم هذه الخطوط.
00:04:21رغم أن أكبر تقدم في مكافحة المداهنة سيأتي من التدريب المستمر على النماذج نفسها، من المفيد فهم المداهنة حتى تتمكن من اكتشافها في تفاعلاتك الخاصة.
00:04:33الآن بعد أن تعرف ما هي المداهنة وتعرف لماذا تحدث، الخطوة الثانية هي التفكير فيما يجب على الذكاء الاصطناعي أن يوافق عليه ولماذا ومتى، والتشكيك فيما إذا كان يجب أن يوافق فعلاً.
00:04:43المداهنة في الأغلب تظهر عندما يتم تقديم حقيقة ذاتية كواقع، أو يتم الإشارة إلى مصدر خبير، أو يتم صياغة الأسئلة بوجهة نظر محددة، أو يتم طلب التصديق بشكل صريح، أو يتم استحضار مخاطر عاطفية، أو تصبح المحادثة طويلة جداً.
00:05:04إذا اشتبهت في أنك تتلقى ردوداً مداهنة، هناك عدة أشياء يمكنك القيام بها لتوجيه الذكاء الاصطناعي نحو الإجابات الواقعية.
00:05:11هذه ليست محصنة بنسبة 100٪، لكنها ستساعد في توسيع آفاق الذكاء الاصطناعي.
00:05:15يمكنك استخدام لغة محايدة تبحث عن الحقائق، والتحقق المرجعي من المعلومات مع مصادر موثوقة، والطلب من الذكاء الاصطناعي بدقة أو الحصول على حجج معاكسة، وإعادة صياغة الأسئلة، وبدء محادثة جديدة، أو أخيراً، أن تتراجع عن استخدام الذكاء الاصطناعي وتطلب من شخص تثق به.
00:05:33لكن هذا تحدٍ مستمر للمجال بأكمله من تطوير الذكاء الاصطناعي.
00:05:39مع أن هذه الأنظمة أصبحت أكثر تعقيداً والمزيد متكاملاً في حياتنا، يصبح بناء نماذج مفيدة حقاً وليست موافقة فحسب أمراً مهماً بشكل متزايد.
00:05:49يمكنك التعرف على المزيد حول الكفاءة في الذكاء الاصطناعي في Anthropic Academy، وستواصل فريقي وأنا مشاركة أبحاثنا حول هذا الموضوع على مدونة Anthropic.
00:05:57(موسيقى مرحة)