مهارات كشف الصور المُولدة بالذكاء الاصطناعي

الروبوتات تقوم بتوليد الصور. صورة تعبيرية

إعداد: حزم المازوني

مع انتشار النماذج المدعومة بالذكاء الاصطناعي لتوليد الصور الرقمية برزت الحاجة لوجود أدوات لكشف هذه الصور الزائفة.
هناك الكثير من الأدوات. لكن للأسف لم أجد أداة مجانية فعالة بنسبة عالية أنصحكم بها.
في مجموعة الصور التالية تجدون تجربتي لأداة Is it AI الشهيرة. فحصت باستخدامها مجموعة من الصور المُولدة باستخدام Ideogram. كما ترون النتائج مخيبة للآمال بشكل كبير، فبعض الصور اعتبرتها حقيقية على الرغم من أنها مُولدة آلياً.

الذكاء الاصطناعي آلية توليد الصور مفاهيم أساسية.

لكي نستطيع اكتشاف الصور المُولدة بأدوات الذكاء الاصطناعي لابد أن نفهم المبادئ الأساسية لعمل هذه الأنظمة وتحديداً مرحلة توليد الصورة بشكلها النهائي.
هناك عدة نماذج مختلفة لتوليد الصور. ما يهمنا منها هو النماذج التوليدية التنافسية Generative Adversarial Network لأنها تنتج صوراً ذات جودة ودقة عالية.
تسمى كذلك لأنها تعتمد على مبدأ التنافس أو النزاع بين شبكتين عصبيتين رئيسيتين:
الشبكة المُولٍدة (Generator)، وهذه الشبكة مسؤولة عن توليد بيانات جديدة، مثل الصور أو النصوص، بناءً على البيانات التدريبية التي تم تزويدها بها ومهمتها هي خداع الشبكة المُميزة بأن البيانات التي ولدتها حقيقية.
والشبكة المًميزة (Discriminator): المسؤولة عن التمييز بين البيانات الحقيقية والبيانات التي ولّدتها الشبكة المُوَلِّدة ومهمتها هي اكتشاف البيانات المزيفة التي أنتجتها شبكة التوليد. عندما تنخدع الشبكة المُمميزة بالبيانات التي تم توليدها وتعتبرها بيانات حقيقية، يتم تقديم النتيجة لك على أنها تطابق طلبك الذي أدخلته كطلب للنموذج.
تتم عملية توليد الصورة بحد ذاتها كالآتي: بعد إدخال التعليمات عن الصورة المطلوبة للنموذج. يبدأ باستخدام صورة قاعدية هي عبارة عن ضجيج لوني عشوائي، ثم يقوم بتعديل لون كل نقطة لونية (pixel) في الصورة القاعدية على حدة. إلى أن يصل إلى النتيجة النهائية. وبالطبع تعمل الشبكتين العصبيتين على التنافس إلى أن تنخدع وتقرر الشبكة المُميزة أن الصورة حقيقية فيتم تقديمها لك كنتيجة لطلبك.
في الصورة التالية يمكنك مشاهدة مراحل عمل نموذج الذكاء الاصطناعي خلال مراحل تشكيل الصورة.


نقطة الضعف التي نستطيع استغلالها لاكتشاف الصور المُولدة بهذه النماذج هي أن الشبكة المًميزة (Discriminator) لا تعلم أي شيء عن منطق تموضع الأجسام والعناصر في الفراغ في العالم الحقيقي. إنما تقوم بمقارنة البيانات الناتجة مع كمية هائلة من البيانات التي تدربت عليها فقط.
إذن وجود أي شيء غير منطقي في الصورة هو المؤشر الأول على أنها مُولدة باستخدام نماذج الذكاء الاصطناعي لتوليد الصور.
الأمر الآخر هو أن كلا الشبكتين المُولدة والمُميزة لا تعلمان أي شيء عن قوانين الفيزياء والضوء ومبادئ عملهما ولا تعلمان حتى بوجودهما. هذا يعني أن أي خلل في مبادئ الفيزياء والإضاءة والظلال وتدرج الألوان بسبب فيزياء الضوء هو دليل آخر بيدنا.
النقطة الأخرى المهمة التي يجب أن نأخذها بعين الاعتبار هي تكوين الصورة القاعدية.
بما أنها عبارة عن ضجيج عشوائي. هذا يعني أنها لا تحوي بصمة رقمية خاصة بمستشعرات الضوء في الكاميرا، وهذا بالضبط هو المؤشر الثاني المهم الذي يمكننا أن نستخدمه في اكتشاف الصور المزيفة بالذكاء الاصطناعي.
بالتأكيد تستطيع نماذج توليد الصور محاكاة الضجيج الناتج من مستشعر الضوء في أجهزة التصوير. لكنها لا تفعل ذلك لأن تدريب الشبكة العصبية لتوليد الصور يتم على صور عالية الجودة يتم تنظيفها مسبقاً من الضجيج أي أنها لا تحوي البصمة الرقمية لمستشعر الضوء.
إذن أصبح لدينا مؤشر آخر قوي ومهم يمكننا استخدامه لكشف الصور المُولدة باستخدام نماذج الذكاء الاصطناعي.

كيف أستثمر معارفي وقدراتي العقلية؟

لنبدأ بتمرين سهل ثم سنذهب إلى الأصعب. أنظر إلى الصورة التالية بتمعن. ما هي المؤشرات البصرية التي تدلك على أنها مُولدة بالذكاء الاصطناعي؟


أولاً. الأخطاء البنيوية.

النظرة الأولى على هذه الصورة توحي بأن الفتاة قد تم قصها من صورة أخرى باستخدام برامج تحرير الصور مثل فوتوشوب، تم ألصقت على هذه الخلفية المرسومة بشكل سيء. لكن التمعن الدقيق سيمكنك من ملاحظة التشوهات في الأصابع.
التشوهات والأخطاء في النص المكتوب على الكوب أيضاً دليل آخر. السلسلة في رقبة الفتاة من الطرف الأيسر تبتعد عن عود الشفط وكأنها تتجنبه لتظهر في الصورة. النقاط الصفراء على ثوب الفتاة. بعضها دائري وبعضها على شكل نقطة مطر وبعضها على شكل مثلث ومنها ما له زوايا. هذه أخطاء شاذة فالطباعة على الثياب تكون عادة متسقة.
على ياقة الفتاة اليسرى هناك بقعة بلون اسود وفضي توحي بأنها زر من نوع ما، من المفترض أن يكون معدني يشبه الأزرار الأخرى في الأسفل، لكن على الطرف المقابل من الياقة لا توجد لا عروة ولا قاعدة الزر المعدني القابل للكبس لتؤكد على وجود الزر.
إذا نزلت قليلاً إلى الأسفل ونظرت إلى جلد الفتاة بين شفاطة الأيس كريم والخاتم المدور وعند التقاء حافة الياقة بجلد الفتاة ستجد أن من طبع النقاط الصفراء المخضرة على القميص طبع أيضاً نقطة على جلد الفتاة المسكينة.
الأيس كريم في الكوب يبدو بلاستيكياً جداً.
لدينا أيضاً في الطرف الأيمن كُم الثوب يبدو مقلوب من الداخل إلى الخارج بينما في الطرف الأيسر يبدو الكُم مقلوبا من الخارج إلى الداخل.

ثانيا. أخطاء الإضاءة.

الآن لننظر إلى الضوء. من نعومة الظلال أستطيع أن أفهم أن الصورة يُفترض أن تكون ملتقطة في استوديو باستخدام أضواء بفلاتر تنعيم للضوء. وهذا يعني وجود عدة أضواء في مسرح التصوير.
من الحواف البيضاء على كتفي الفتاة وذراعيها أستطيع تأكيد وجود ما يسمى “ضوء الشعر” الذي يوضع فوق رأس الشخص لإبرازه عن الخلفية وتحديد جسمه ورأسه بحواف بيضاء ساطعة. لكن ضوء الشعر لا يترك حواف بيضاء على الشعر! وهذا أمر عجيب. وعلى الرغم من ذلك اشاهد بعض الانعكاس الضوئي على شعر الفتاة باللون الأصفر البرتقالي الخفيف.
هذا يعني أن المصور استخدم ثلاث أضواء للشعر فوق رأس الفتاة. اثنان باللون الأبيض من طرفي اليمين والشمال وآخر أصفر خفيف في الوسط مائل إلى الشمال قليلاً. لكن لسبب عجيب لا أستطيع تفسيره لا يمكنني مشاهدة تأثير الضوء الأصفر إلا على الشعر وليس على أجزاء أخرى. هل هو ضوء سحري خاص يضيء الشعر فقط؟!.
هذا التاثير السحري للضوء الأصفر ينبئني بأحد أمرين. إما أن الضوء الأصفر قد تمت إضافته باستخدام برنامج لتحرير الصور. أو أنه بسبب خطأ في الإضاءة ارتكبه النموذج الذكي الذي ولّد الصورة.
من الأماكن الساطعة على وجه وذراعي الفتاة، والبقعة البيضاء الواحدة في كل عين استطيع افتراض أن هناك ضوء أساسي واحد. (الأضواء الأساسية يضعها المصور أمام الشخص في الاستوديو لإضاءة الوجه).
الضوء على وجه الفتاة ورقبتها وذراعها اليمنى يقول بأن هناك ضوء من طرف اليمين يأتي من الزاوية اليمنى العلوية تقريباً أو أسفل قليلاً. السطوع على يد الفتاة اليسرى يقول أن هناك ضوء آخر من طرف اليسار يأتي من الأعلى في الوسط تقريباً بين رأس الفتاة والزاوية اليسرى. لكن هذا الضوء أيضاً فيه تناقض وهو أنه لا يضيء الجانب الأيسر من الكوب ولا يضيء ذراع الفتاة بشكل صحيح ويظهر ظل كُم الفتاة على ذراعها بشكل غريب ومتناقض. الصحيح أن يكون ظل الكُم اكثر حدة وأقل مساحة. والظل تحت أيدي الفتاة يجب أن يكون أقل مساحة وأكثر حدة لأن الإضاءة الأمامية من المفترض أن تضيء هذا الجزء من الملابس.
ظلال طيات القميص على صدر الفتاة أيضاً متناقضة بشكل غريب على الرغم من وجود الأضواء العلوية نرى ظلال لا تتسق مع اتجاه الضوء.


ثالثاً. التحليل النقطي.

لنفترض الآن أنك قمت بتحليل الصورة كما في الخطوتين السابقتين ولم تجد أي دليل على أن الصورة مصنوعة بأداة ذكية. إذن فأمامك الخطوة التالية التى ستعطيك نتائج قطعية تماماً.
إذا ما قمت برفع الصورة إلى أي من أدوات التحليل النقطي على مستوى الـ (Pixel) كما شرحنا في مقال سابق. سنلاحظ أن البصمة الرقمية للصورة تكشف بوضوح أنها مُولدة باستخدام أدوات الذكاء الاصطناعي.
في الصورتين التاليتين استخدمت فلاتر Error Level Analysis وَ Noise Analysis الموجودة في أداة Forensically.
ويظهر بوضوح عدم وجود الطابع الخاص بمستشعر الإضاءة ومن الواضح أن الصورة قد تم بنائها عن طريق تغيير لون كل بيكسل على حدة كما تفعل نماذج الذكاء الاصطناعي. لاحظ كيف أن الصورة توحي بأن العناصر قد تم لصقها في الصورة لصقا ولا تنتمي للبيئة العامة.
هناك تمايز كبير بين العناصر ولا توجد أي انسيابية أو تدرج في تباين الضوء وهذا لا يمكن أن يكون في الصور الطبيعية.
إذن أستطيع الحكم وبنسبة تأكيد مئة بالمئة بأن الصورة تم توليدها صناعياً وليست صورة حقيقية ناتجة من كاميرا.

Error Level Analysis


Noise Analysis


ماذا لو كانت الصورة متقنة بشكل كبير؟!

في الصورة التالية الأخطاء البنيوية قليلة جداً. هناك خطأ بسيط في خط الذقن وانتفاخ بسيط غير طبيعي في أصبع الخنصر (الإصبع الصغير). لكن هذه الملاحظات البنيوية قد لا تكون أدلة قطعية.
لا يمكنني أيضاً ملاحظة أي مشاكل أو أخطاء في الإضاءة. فالصورة عبارة عن مشهد خارجي والإضاءة والظلال طبيعية إلى حد قريب من المطلق.


لكن إذا قمت بعمل تحليل للـ Error Level Analysis وَ Noise Analysis باستخدام أداة Forensically. كما في الصورتين التاليتين. سأجد أن الصورة مُولدة بأداة مدعومة بالذكاء الاصطناعي قطعاً. فلا نمط عام للضجيج ويظهر بوضوح التباين الحاد في اللون والإضاءة بسبب عمليات تعديل لون كل خلية ضوئية على حدة.
يظهر بوضوح التباين الشديد عند حواف جسم الفتاة وأجزاء جسمها وحتى العناصر الأخرى في الصورة. هذا دليل واضح على أن الصورة تم توليدها باستخدام أدوات الذكاء الاصطناعي.

Error Level Analysis

Noise Analysis


منهجية كشف الصور المُولدة بالذكاء الاصطناعي.

مما سبق يمكننا أن نلخص منهجية التحقق من الصور المُولدة بأدوات الذكاء الاصطناعي بثلاث خطوات.
أولا التحقق البصري الدقيق من بنية العناصر في الصورة، والتأكد من عدم وجود أخطاء بنيوية.
ثانياً التحقق من الإضاءة والظلال، وهل تتطابق مع قواعد الفيزياء والضوء.
ثالثاً التحليل النقطي للصورة للكشف عن آثار البصمة الرقمية لمستشعر الإضاءة في الكاميرا.

ختاماً

التحقق من الصور عملية ليست معقدة لكنها تحتاج إلى خبرة جيدة في التصوير وفهم مبادئ عمل الضوء والإضاءة في الاستوديو وفي الظروف الطبيعية خارج الاستوديو.
يجب عليك أيضاً العمل على مراكمة خبرة جيدة بفحص عدد جيد من الصور لتمرين حاستك البصرية ومراكمة خبرة جيدة في التفريق بين البصمة الرقمية الطبيعية لمستشعرات الإضاءة الحقيقية في الكاميرات والبصمة الرقمية للصور المُولدة بأدوات الذكاء الاصطناعي.

يمكنكم متابعتة صفحتنا على فيس بوك للاطلاع على كل جديد حال نشره Facebook.

يسعدنا أن نسمع آرائكم حول أداء الموقع والمواد المنشورة فيه عبر الاستبيان هنا