🥷 #OpenAI and Paradigm launched EVMbench, a benchmark designed to measure how well #يمكن لوكلاء الذكاء الاصطناعي اكتشاف وتصحيح واستغلال الثغرات عبر أنظمة EVM مثل إيثريوم. تم بناء المعيار من 120 ثغرة عالية الخطورة تم اختيارها من 40 تدقيقًا ويشمل سيناريوهات تتعلق بسلسلة Tempo. تظهر الاختبارات أن GPT-5.3-Codex حقق 72.2% في وضع "الاستغلال" مقارنة بـ GPT-5 الذي حقق 31.9%، بينما لا تزال التغطية لاكتشاف الثغرات وتصحيحها غير مكتملة. #اختراق
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
🥷 #OpenAI and Paradigm launched EVMbench, a benchmark designed to measure how well #يمكن لوكلاء الذكاء الاصطناعي اكتشاف وتصحيح واستغلال الثغرات عبر أنظمة EVM مثل إيثريوم. تم بناء المعيار من 120 ثغرة عالية الخطورة تم اختيارها من 40 تدقيقًا ويشمل سيناريوهات تتعلق بسلسلة Tempo. تظهر الاختبارات أن GPT-5.3-Codex حقق 72.2% في وضع "الاستغلال" مقارنة بـ GPT-5 الذي حقق 31.9%، بينما لا تزال التغطية لاكتشاف الثغرات وتصحيحها غير مكتملة. #اختراق
#تشفير