GAUSS ne concerne pas seulement la capacité des LLM à donner la bonne réponse, mais montre aussi leurs forces et faiblesses dans différentes compétences en mathématiques. Fier de dévoiler notre recherche pour le benchmark GAUSS avec des chercheurs de CalTech, UC Berkeley, Stanford, NVIDIA, de l'Université de Washington et de l'Université de HK. Découvrez-le à