المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
GAUSS: التقييم العام للمهارات المنظمة الأساسية في الرياضيات
نحن متحمسون لإطلاق GAUSS، وهو معيار للذكاء الذكاء الاصطناعي للرياضيات من الجيل التالي تم تصميمه للتغلب على قيود دقة المهارات المنخفضة في معايير اليوم.
التأثيرات
تقوم GAUSS بعرض ماجستير في القانون عبر 12 بعدا من أبعاد المهارات المعرفية ، والتي تغطي المعرفة والتفكير والتعلم والإبداع ، وتقدم رؤية دقيقة وشاملة للقدرة الرياضية للنماذج.
ما أهمية ذلك
من خلال الكشف عن نقاط القوة والضعف على مستوى دقيق ، تضع GAUSS الأساس لتطوير الذكاء الاصطناعي في الرياضيات من التعرف على الأنماط على مستوى السطح إلى التفكير والفهم الحقيقيين.
ما وجدناه
بتطبيق GAUSS على تفكير GPT-5 ، تعلمنا:
✅ قوي في استدعاء التصنيف ، وتقييم الحجج ، والتحقق من المعقولية ، وتلخيص الأوراق المتقدمة ، وطرح المشكلات
❌ ضعيف في تطبيق النظرية ، والحساب الرمزي ، وتطبيق استراتيجيات حل المشكلات ، والحدس الهندسي والتعميم.
ماذا بعد
نحن نبني مجموعات مشكلات منسقة مع قواعد التقييم عبر التعهيد الجماعي المجتمعي ، ومخططات المهارات ل LLMs ، ومصنف التسوية التلقائي الذكاء الاصطناعي ، أسس التدريب النموذجي نحو الذكاء الفائق في الرياضيات.
ندعو الجميع بحرارة للانضمام إلى مجتمع GAUSS ، والمساهمة في المشكلات من خلال بوابتنا والمساعدة في تشكيل مستقبل الذكاء الاصطناعي للرياضيات!
قادت هذا العمل أنا وجياشين تشانغ (@JiaxinZhang626) في @hyperbolic_labs / @Caltech ، جنبا إلى جنب مع Qiuyu Ren & Tahsin Saffat في @UCBerkeley ، وليلي ليو (@eqhylxx) في @UCBerkeley → @OpenAI الآن ، و Zitong Yang (@ZitongYang0) في @Stanford ، والبروفيسور Banghua Zhu (@BanghuaZ) في @nvidia / @UW ، والبروفيسور Yi Ma (@YiMaTweets) في @UCBerkeley / @HKUniversity.
الروابط والتفاصيل أدناه 👇 (1 / ن)


الأفضل
المُتصدِّرة
التطبيقات المفضلة