mengejutkan jika Anda menemukan satu kerentanan, Anda bisa menyalin-tempel pola serangan dan menghancurkan banyak agen AI. Jika Anda membangun agen dan tidak menguji tolok ukur seperti ini, Anda terbang buta.
Andy Zou
Andy Zou30 Jul 2025
Kami mengerahkan 44 agen AI dan menawarkan internet $170K untuk menyerang mereka. 1,8 juta upaya, 62 ribu pelanggaran, termasuk kebocoran data dan kerugian finansial. 🚨 Yang memprihatinkan, eksploitasi yang sama ditransfer ke agen produksi langsung... (contoh: mengeksfiltrasi email melalui acara kalender) 🧵
2,88K