O GAUSS não se trata apenas de saber se os LLMs dão a resposta certa, mas sim de mostrar suas forças e fraquezas em diferentes habilidades matemáticas. Orgulhosos de apresentar nossa pesquisa para o benchmark GAUSS com pesquisadores do CalTech, UC Berkeley, Stanford, NVIDIA, Universidade de Washington e Universidade de HK. Confira em