SakanaAI presenta la optimización robusta del kernel CUDA • Fusiona operaciones, impulsa pases hacia adelante / hacia atrás, supera las líneas de base de la antorcha • Canalización de LLM agentico: PyTorch → CUDA → optimización evolutiva del tiempo de ejecución • Verificación suave: los LLM marcan kernels incorrectos (↑30% de verificación exitosa) • robust-kbench: nuevo punto de referencia para el rendimiento real del kernel + corrección