Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
GAUSS: Evaluación General de Habilidades Estructuradas Subyacentes en Matemáticas
Estamos emocionados de lanzar GAUSS, un estándar de inteligencia artificial en matemáticas de próxima generación diseñado para superar las limitaciones de baja resolución de habilidades en los estándares actuales.
Qué hace
GAUSS perfila LLMs a través de 12 dimensiones de habilidades cognitivas, abarcando conocimiento, razonamiento, aprendizaje y creatividad, ofreciendo una visión precisa y completa de la capacidad matemática de los modelos.
Por qué es importante
Al exponer fortalezas y debilidades a un nivel detallado, GAUSS sienta las bases para avanzar en la inteligencia artificial matemática desde el reconocimiento de patrones superficial hacia un razonamiento y comprensión genuinos.
Lo que encontramos
Al aplicar GAUSS a GPT-5 Thinking, aprendimos:
✅ Fuerte en recuerdo de taxonomía, evaluación de argumentos, comprobaciones de plausibilidad, resumen de artículos avanzados y planteamiento de problemas
❌ Débil en aplicación de teoremas, cálculo simbólico, aplicación de estrategias de resolución de problemas, intuición geométrica y generalización.
Qué sigue
Estamos construyendo conjuntos de problemas curados con rúbricas a través de la colaboración comunitaria, gráficos de habilidades para LLMs y un autoevaluador de IA, fundamentos para el entrenamiento de modelos hacia la superinteligencia matemática.
Invitamos calurosamente a todos a unirse a la comunidad GAUSS, contribuir con problemas a través de nuestro portal y ayudar a dar forma al futuro de la IA en matemáticas.
Este trabajo fue liderado por mí y Jiaxin Zhang (@JiaxinZhang626) en @hyperbolic_labs / @Caltech, junto con Qiuyu Ren y Tahsin Saffat en @UCBerkeley, Lily Liu (@eqhylxx) en @UCBerkeley → ahora en @OpenAI, Zitong Yang (@ZitongYang0) en @Stanford, Prof. Banghua Zhu (@BanghuaZ) en @nvidia / @UW, y Prof. Yi Ma (@YiMaTweets) en @UCBerkeley / @HKUniversity.
Enlaces y detalles a continuación 👇 (1/n)


Parte superior
Clasificación
Favoritos