GAUSS: загальна оцінка базових структурованих навичок у математиці Ми раді представити GAUSS, тест нового покоління математичного штучного інтелекту, створений для подолання обмежень низької роздільної здатності навичок у сьогоднішніх тестах. Що він робить GAUSS профілює LLM за 12 вимірами когнітивних навичок, що охоплюють знання, міркування, навчання та творчість, пропонуючи точне та всебічне уявлення про математичні здібності моделей. Чому це важливо Виявляючи сильні та слабкі сторони на детальному рівні, GAUSS закладає основу для розвитку математичного штучного інтелекту від розпізнавання шаблонів на поверхневому рівні до справжнього міркування та розуміння. Що ми з'ясували Застосовуючи GAUSS до мислення GPT-5, ми дізналися: ✅ Сильний у запам'ятовуванні таксономії, оцінці аргументів, перевірці правдоподібності, узагальненні передових робіт та постановці проблем ❌ Слабкий у застосуванні теорем, символьних обчисленнях, застосуванні стратегій розв'язання задач, геометричній інтуїції та узагальненні. Що далі Ми створюємо кураторські набори задач з рубриками за допомогою краудсорсингу спільноти, діаграмами навичок для LLM та автогрейдером зі штучним інтелектом, основою для навчання моделей до математичного суперінтелекту. Ми щиро запрошуємо всіх приєднатися до спільноти GAUSS, вносити свої корективи через наш портал і допомагати формувати майбутнє Math AI! Цю роботу очолювали я і Цзясін Чжан (@JiaxinZhang626) в @hyperbolic_labs / @Caltech, разом з Цюю Жень і Тахсін Саффат в @UCBerkeley, Лілі Лю (@eqhylxx) в @UCBerkeley → зараз @OpenAI, Цзитун Ян (@ZitongYang0) в @Stanford, професор Банхуа Чжу (@BanghuaZ) в @nvidia / @UW і професор І Ма (@YiMaTweets) в @UCBerkeley / @HKUniversity. Посилання та подробиці нижче 👇 (1/n)