GAUSS không chỉ là về việc liệu LLM có đưa ra câu trả lời đúng hay không, mà còn cho thấy những điểm mạnh và điểm yếu của chúng trong các kỹ năng khác nhau trong toán học. Tự hào công bố nghiên cứu của chúng tôi cho tiêu chuẩn GAUSS cùng với các nhà nghiên cứu từ CalTech, UC Berkeley, Stanford, NVIDIA, Đại học Washington và Đại học HK. Hãy xem tại