🚨 بيع 🚨 فلاش الزائدي
خصم 50٪ على وحدات معالجة الرسومات في نهاية هذا الأسبوع!
⚡ H100s + Infiniband → 0.99 دولار / ساعة فقط
أي حالة بدأت بعد الساعة 6 مساء بتوقيت المحيط الهادئ اليوم وتستمر حتى يوم الاثنين 8 صباحا بتوقيت المحيط الهادئ سيتم تعويضها في أرصدة لتصل إلى المعدل الفعلي البالغ 0.99 دولار.
لا يتعلق GAUSS فقط بما إذا كان LLMS سيحصلون على الإجابة الصحيحة ، بل يظهر نقاط قوتهم وضعفهم عبر مهارات مختلفة في الرياضيات.
نفخر بالكشف عن بحثنا لمعيار GAUSS مع باحثين من معهد كاليفورنيا للتكنولوجيا وجامعة كاليفورنيا في بيركلي وستانفورد وNVIDIA وجامعة واشنطن وجامعة هونج كونج. تحقق من ذلك على
GAUSS: التقييم العام للمهارات المنظمة الأساسية في الرياضيات
نحن متحمسون لإطلاق GAUSS، وهو معيار للذكاء الذكاء الاصطناعي للرياضيات من الجيل التالي تم تصميمه للتغلب على قيود دقة المهارات المنخفضة في معايير اليوم.
التأثيرات
تقوم GAUSS بعرض ماجستير في القانون عبر 12 بعدا من أبعاد المهارات المعرفية ، والتي تغطي المعرفة والتفكير والتعلم والإبداع ، وتقدم رؤية دقيقة وشاملة للقدرة الرياضية للنماذج.
ما أهمية ذلك
من خلال الكشف عن نقاط القوة والضعف على مستوى دقيق ، تضع GAUSS الأساس لتطوير الذكاء الاصطناعي في الرياضيات من التعرف على الأنماط على مستوى السطح إلى التفكير والفهم الحقيقيين.
ما وجدناه
بتطبيق GAUSS على تفكير GPT-5 ، تعلمنا:
✅ قوي في استدعاء التصنيف ، وتقييم الحجج ، والتحقق من المعقولية ، وتلخيص الأوراق المتقدمة ، وطرح المشكلات
❌ ضعيف في تطبيق النظرية ، والحساب الرمزي ، وتطبيق استراتيجيات حل المشكلات ، والحدس الهندسي والتعميم.
ماذا بعد
نحن نبني مجموعات مشكلات منسقة مع قواعد التقييم عبر التعهيد الجماعي المجتمعي ، ومخططات المهارات ل LLMs ، ومصنف التسوية التلقائي الذكاء الاصطناعي ، أسس التدريب النموذجي نحو الذكاء الفائق في الرياضيات.
ندعو الجميع بحرارة للانضمام إلى مجتمع GAUSS ، والمساهمة في المشكلات من خلال بوابتنا والمساعدة في تشكيل مستقبل الذكاء الاصطناعي للرياضيات!
قادت هذا العمل أنا وجياشين تشانغ (@JiaxinZhang626) في @hyperbolic_labs / @Caltech ، جنبا إلى جنب مع Qiuyu Ren & Tahsin Saffat في @UCBerkeley ، وليلي ليو (@eqhylxx) في @UCBerkeley → @OpenAI الآن ، و Zitong Yang (@ZitongYang0) في @Stanford ، والبروفيسور Banghua Zhu (@BanghuaZ) في @nvidia / @UW ، والبروفيسور Yi Ma (@YiMaTweets) في @UCBerkeley / @HKUniversity.
الروابط والتفاصيل أدناه 👇 (1 / ن)