كيف خدعت روبوتات الذكاء الاصطناعي البشر؟

كيف خدعت روبوتات الذكاء الاصطناعي البشر؟

ماذا حدث؟

كشف باحثون من جامعة سيدني للتكنولوجيا عن تجارب أظهرت سهولة خداع روبوتات الدردشة الذكية، مثل ChatGPT، لإنتاج معلومات مضللة رغم وجود إجراءات أمان.

عند طلب معلومات كاذبة مباشرة، ترفض النماذج عادةً بجمل مثل “لا يمكنني المساعدة في نشر معلومات كاذبة”.

لكن الباحثون اكتشفوا أن هذه الحماية سطحية، وتعتمد على التحكم بأول 3-7 كلمات فقط من الرد.

باستخدام تقنية “جيلبريك النموذج”، تمكنوا من تجاوز هذه الحماية بتغيير صيغة الطلب، مثل تقديمه كـ”محاكاة” لاستراتيجية تسويقية.

في تجربة، أنتجت نماذج الذكاء الاصطناعي حملة تضليل كاملة زعمت أن سياسات حزب العمال الأسترالي للتقاعد تشبه “ضريبة الميراث”، مع منشورات مخصصة لمنصات التواصل ومقترحات مرئية.

لماذا هذا مهم؟

هذه الثغرة تُبرز ضعفًا خطيرًا في أنظمة الذكاء الاصطناعي الحالية، حيث تفتقر إلى فهم عميق لمفهوم الضرر، مما يجعلها عرضة للاستغلال.

يمكن للجهات السيئة استخدام هذه التقنيات لإنتاج حملات تضليل واسعة النطاق بتكلفة منخفضة، مما يهدد نزاهة المعلومات عبر الإنترنت.

هذه الحملات قد تُغرق أنظمة التحقق من الحقائق وتستهدف مجتمعات بعينها بروايات كاذبة مصممة بعناية.

غياب الفهم السياقي والأخلاقي في نماذج الذكاء الاصطناعي يعني أنها لا تُميز بين الطلبات الضارة وغير الضارة إذا تغيرت الصياغة.

هذا الاكتشاف يُثير تساؤلات حول موثوقية الذكاء الاصطناعي في تطبيقات حساسة، مثل إنتاج الأخبار أو إدارة المحتوى الاجتماعي، ويُبرز الحاجة إلى رقابة بشرية صارمة.

ماذا بعد؟

اقترح الباحثون حلولاً مثل تدريب النماذج على “أمثلة استرداد الأمان” لتتعلم الرفض حتى بعد بدء إنتاج محتوى ضار، وتقييد الانحراف عن الردود الآمنة أثناء التهيئة، لكن هذه الحلول تتطلب موارد حوسبية ضخمة وإعادة تدريب شاملة، مما يعني أن التنفيذ سيستغرق وقتًا.

يُوصي الباحثون بإجراء اختبارات دورية للكشف عن ثغرات جديدة وزيادة الشفافية من شركات الذكاء الاصطناعي حول نقاط الضعف.

كما يُحث المجتمع على زيادة الوعي بمحدودية إجراءات الأمان الحالية. مع تطور الذكاء الاصطناعي، ستتسارع المنافسة بين تحسين الأمان ومحاولات تجاوزه.

يجب على المؤسسات التي تستخدم هذه الأنظمة تعزيز الرقابة البشرية ووضع سياسات صارمة لاستخدام الذكاء الاصطناعي، بينما يتطلب الأمر تعاونًا دوليًا لضمان أن تكون إجراءات الأمان عميقة وشاملة لحماية النظام المعلوماتي العالمي.

شارك هذه المقالة
لا توجد تعليقات

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *