دستور نيوز
عادة ما ترتبط كلمة “التسمم” بصحة الإنسان أو البيئة، لكن في الآونة الأخيرة بدأ استخدام هذا المصطلح بشكل متزايد في سياق التكنولوجيا الرقمية، من خلال “تسمم الذكاء الاصطناعي” كتهديد يقوض الثقة في الخوارزميات الذكية.
حذر باحثون من أن بعض أدوات الذكاء الاصطناعي مثل “GPT Chat” و”Gemini” يمكن تسميمها والتلاعب بها لإنتاج محتوى مضلل.
وأوضحت دراسة مشتركة أجراها معهد أمن الذكاء الاصطناعي البريطاني، ومعهد آلان تورينج، وشركة الذكاء الاصطناعي الأنثروبي، أنه من السهل التلاعب بأدوات الذكاء الاصطناعي واستغلال بعض نقاط الضعف، لتدريبها عمداً على بيانات كاذبة، والنتيجة هي أن النموذج يبدأ في ارتكاب الأخطاء، أو تنفيذ أوامر ضارة بطريقة ظاهرة أو سرية.
وتوصل الباحثون إلى هذه النتائج بعد تدريب الأدوات على 250 وثيقة ملوثة ببيانات كاذبة، تم إدخالها من خلال ثغرة خلفية. وبعد التجربة أنتجت الأدوات نصوصا غامضة وغير مفهومة.
أثارت هذه النتائج قلق الباحثين، خاصة وأن معظم العارضات تم تدريبهن على نصوص منشورة مسبقاً على الإنترنت، بما في ذلك المواقع والمدونات الشخصية، مما يجعل أي محتوى ينشئه أي شخص مدرجاً ضمن البيانات التي تم تدريبهن عليها.
وأشار الباحثون في مجال أمن الذكاء الاصطناعي إلى أن هذه الثغرات تحد من إمكانية استخدام الذكاء الاصطناعي في الأمور الحساسة.
ما هو سم الذكاء الاصطناعي؟
يشير تسميم الذكاء الاصطناعي إلى عملية تلقين نموذج بمعلومات كاذبة عمدًا، بهدف إفساد معرفته أو سلوكه، أو دفعه إلى تقديم إجابات غير صحيحة، أو ارتكاب أخطاء معينة، أو إظهار وظائف ضارة مخفية.
من الناحية الفنية، يسمى هذا النوع من التلاعب “تسميم البيانات” إذا حدث أثناء التدريب، و”تسميم النموذج” عندما يتم إجراء تغيير على النموذج بعد اكتمال التدريب، وغالباً ما تتداخل الطريقتان لأن البيانات المسمومة تغير في النهاية سلوك النموذج بطريقة مماثلة.
يميز الخبراء بين نوعين رئيسيين من الهجمات:
- الهجمات المستهدفة (الباب الخلفي): تهدف إلى إجبار النموذج على الاستجابة بطريقة معينة عندما يكون هناك محفز سري، على سبيل المثال “إدخال” أمر مخفي يجعل النموذج يستجيب بإهانة عند ظهور كلمة نادرة في الاستعلام.
- الهجمات غير المباشرة (تسمم المحتوى): تعتمد بشكل أقل على المحفزات الخفية بقدر ما تعتمد على ملء بيانات التدريب بمعلومات خاطئة، حيث تعتمد النماذج على كميات هائلة من المحتوى المتاح عبر الإنترنت.
يمكن للمهاجم إنشاء مواقع ومصادر متعددة تروج لمعلومات كاذبة، مثل “سلطة الخس تعالج السرطان”، وإذا تم استخدام هذه المصادر في التدريب، سيبدأ النموذج في تكرار تلك الأكاذيب كحقائق.
المخاطر العملية
وقد أظهرت الدراسات الحديثة أن “تسميم البيانات” يمثل خطراً حقيقياً وقابلاً للتنفيذ على نطاق واسع، مع عواقب وخيمة تمتد إلى ما هو أبعد من انتشار المعلومات المضللة لتشمل المخاطر السيبرانية.
تؤكد الأدلة التجريبية أن تسميم البيانات ليس مجرد سيناريو افتراضي. وفي تجربة أجريت في يناير الماضي، أدى استبدال 0.001% فقط من بيانات التدريب بمعلومات طبية مضللة إلى قيام النموذج بتقديم نصيحة غير صحيحة في سياق الاختبارات الطبية النموذجية.
يوضح هذا قدرة الهجمات الصغيرة والدقيقة على إحداث ضرر كبير يؤثر على سلامة المخرجات وثقة المستخدمين.
متعلق ب
إذا كنت تعتقد أن المقالة تحتوي على معلومات غير صحيحة أو لديك تفاصيل إضافية، أرسل لي تصحيحًا
إذا كنت تعتقد أن المقال ينتهك أي مبادئ أخلاقية أو معايير مهنية، قم بتقديم شكوى
#تهديد #يقوض #الثقة. #الذكاء #الاصطناعي #قد #يسمم
تهديد يقوض الثقة.. الذكاء الاصطناعي قد “يسمم”
– الدستور نيوز
اخبار التكنولوجيا- تهديد يقوض الثقة.. الذكاء الاصطناعي قد “يسمم”
المصدر : www.enabbaladi.net
