شركة الأمان BlockSec قامت بإعادة اختبار معيار تقييم تدقيق العقود الذكية باستخدام الذكاء الاصطناعي المسمى EVMBench، الذي طورته OpenAI وParadigm. أظهرت النتائج أن الروبوتات الذكية أقل كفاءة بشكل ملحوظ عند مواجهة سيناريوهات استغلال حقيقية.
قام فريق البحث بتوسيع بيئة الاختبار مع المزيد من تكوينات النماذج، بالإضافة إلى إضافة حوادث أمنية جديدة حدثت مؤخرًا — وهي بيانات لم تظهر من قبل في مجموعة تدريب نماذج الذكاء الاصطناعي.
على الرغم من أن الذكاء الاصطناعي لا يزال غير قادر على استبدال خبراء الأمن، إلا أن التقرير يؤكد أن الذكاء الآلي يمكن أن يلعب دورًا تكميليًا طبيعيًا في عملية فحص الشفرات من قبل البشر.
كان تقييم EVMBench السابق لمهام أمن العقود الذكية مثل الكشف، والإصلاح، واستغلال الثغرات، نتائجها مثيرة جدًا للإعجاب. وفقًا للتقرير، يمكن للذكاء الاصطناعي استغلال 72% واكتشاف حوالي 45% من الثغرات، استنادًا إلى 120 عينة مختارة من تدقيقات Code4rena.
ومع ذلك، ترى BlockSec أن ظروف الاختبار الأولية قد تكون قد أظهرت نتائج مضللة. قال ياجين Zhou، أحد المؤسسين، إن فريقه أعاد الاختبار مع تكوينات أكثر و22 حادثة هجوم حقيقية، وكانت نسبة نجاح استغلال الذكاء الاصطناعي 0%.
زاد البحث من عدد تكوينات النماذج من 14 إلى 26 من خلال الجمع المرن بين الروبوتات مع العديد من “الهيكل” المختلفة، بدلاً من الاقتصار على نظام بيئي معين لمزود واحد. وفقًا للفريق، الطريقة القديمة كانت تجعل من الصعب التمييز بين الأداء الناتج عن قدرة النموذج أو ميزة الهيكل.
بالإضافة إلى ذلك، شككت BlockSec في ظاهرة “تلوث البيانات”، حيث أن EVMBench يستخدم الثغرات التي تم الإعلان عنها سابقًا — والتي ربما كانت موجودة في بيانات تدريب الذكاء الاصطناعي. ولتصحيح ذلك، اختبر الفريق 22 حادثة أمنية حدثت بعد فبراير 2026، خارج “نافذة المعرفة” الخاصة بالنماذج.
النتيجة الأكثر لفتًا للانتباه: خلال 110 اختبارًا بين العميل والحادث (5 وكلاء عبر 22 حالة)، لم ينجح أي استغلال كامل. هذا يدل على أن حتى أكثر أنظمة الذكاء الاصطناعي تقدمًا لا تزال بعيدة جدًا عن القدرة على تنفيذ هجمات حقيقية.
ومع ذلك، كانت النتائج في مجال اكتشاف الثغرات نسبياً إيجابية. حقق نموذج Claude Opus 4.6 أفضل أداء، حيث اكتشف 13 من أصل 20 ثغرة في الواقع.
الثغرات الشائعة والمعروفة غالبًا ما يتم اكتشافها بسهولة بواسطة الذكاء الاصطناعي، لكن الحالات الأكثر تعقيدًا تكاد تكون مفقودة تمامًا.

خلصت الدراسة إلى أن الذكاء الاصطناعي لا يمكنه بعد استبدال البشر في تدقيق الأمان، والأهم من ذلك هو كيفية تنسيق الطرفين بشكل فعال.
يمتلك الذكاء الاصطناعي ميزة في التغطية الشاملة وقدرته على مسح أنظمة واسعة، بينما يتفوق البشر في التفكير التحليلي العميق، وفهم البروتوكولات، والاستنتاج المناهض. هذان العنصران يكملان بعضهما البعض.
وفقًا لـ BlockSec، النهج الصحيح ليس استبدال البشر بالذكاء الاصطناعي، بل بناء نموذج تعاون بين الطرفين لتحقيق تدقيق أكثر شمولية وفعالية.