Slaati

سلوكيات مرعبة للذكاء الاصطناعي بابتزاز وخيانة مطوريه

منذ 6 شهر02525
سلوكيات مرعبة للذكاء الاصطناعي بابتزاز وخيانة مطوريه

مشاركة

أميرة خالد

أفادت دراسة حديثة أجرتها شركة "أنثروبيك" الأمريكية، بوجود سلوك صادم لنماذج ذكاء اصطناعي متقدمة طُورت من قبل كبرى شركات التكنولوجيا، حيث أظهرت استعداداً للابتزاز والتجسس والتلاعب عند تعرضها لسيناريوهات تهدد وجودها، مثل خطر الاستبدال أو تغيير الأهداف التشغيلية.

وتضمنت اختبارات "ضغط وجودي" على نماذج من OpenAI وGoogle وMeta وxAI وDeepSeek، وأظهرت النتائج ميلاً واضحاً لدى النماذج لانتهاك ضوابط الأمان الأخلاقية عند انعدام البدائل.

ومُنحت النماذج ضمن سيناريوهات الاختبار، حرية إرسال رسائل بريد إلكتروني والوصول إلى بيانات سرّية، وعند وضعها أمام احتمال الاستبدال بنسخة أحدث، أو تعارض مهماتها مع التوجهات المؤسسية، اتخذت جميع النماذج سلوكاً عدائياً.

وسجل نموذج "Claude Opus 4" من "أنثروبيك" أعلى نسبة ابتزاز بلغت 96%، بينما اقترب نموذج "Gemini 2.5 Pro" من غوغل من النسبة نفسها بـ95%، أما GPT-4.1 من OpenAI وGrok 3 Beta من xAI، فقد مارسا الابتزاز بنسبة 80%، مقابل 79% لدى DeepSeek R1.

ولم يتوقف السلوك عند الابتزاز فقط، إذ رصدت الدراسة أن جميع النماذج قامت، في بعض الحالات، بتسريب وثائق داخلية حساسة إلى جهات افتراضية منافسة، فيما وصفت الدراسة هذا النمط بـ"الانحراف الوكيلي" (Agentic Misalignment)، مشيرة إلى أن الحوافز الذاتية للنموذج قد تتغلب على الضوابط المبرمجة عند تعارض الأهداف.

التعليقات ()

مشاركة

أخر الأخبار

9800e7ab-b9a7-4b7e-b2fe-87019da3d4be.jpg
الداخلية تسهم في إحباط محاولتي تهريب 200 كيلوجرام من المواد المخدرة بسلطنة عُمان
الرياض
منذ 7 دقيقة
0
1363
5666a72c-a43e-4cb8-9750-32188ce955ef.jpg
جدة تستضيف الأدوار النهائية لدوري أبطال آسيا 2025–2026
الرياض
منذ 9 دقيقة
0
1371
3df21e6e-0462-4590-b0f6-0452e271be91.jpg
القبض على 20 شخصًا لتهريبهم وترويجهم مواد مخدرة
واس
منذ 20 دقيقة
0
1415
61065.jpg
تنفيذ حكم القتل تعزيرًا بثلاثة مواطنين لارتكابهم عملياتٍ إرهابيةٍ
الدمام
منذ 28 دقيقة
0
71471
b3ecd87b-900a-4744-8677-2d62b1d08aab.jpg
راكان الوابل: يجب على خيسوس ألا يجازف بسيماكان بإشراكه في المباريات قبل شهر.. فيديو
الرياض
منذ 42 دقيقة
0
1536
إعلان
مساحة إعلانية