O GAUSS não se trata apenas de saber se os LLMs obtêm a resposta certa, ele mostra seus pontos fortes e fracos em diferentes habilidades em matemática. Orgulho de revelar nossa pesquisa para o benchmark GAUSS com pesquisadores da CalTech, UC Berkeley, Stanford, NVIDIA, Universidade de Washington e Universidade de Hong Kong. Confira em