GAUSS non riguarda solo se i LLM forniscono la risposta giusta, ma mostra i loro punti di forza e di debolezza in diverse abilità matematiche. Siamo orgogliosi di presentare la nostra ricerca per il benchmark GAUSS con ricercatori di CalTech, UC Berkeley, Stanford, NVIDIA, Università di Washington e Università di HK. Scoprilo su