SakanaAI apresenta otimização robusta do kernel CUDA agêntico • Fusível operações, aumenta as passagens para frente/para trás, supera as linhas de base da tocha • Pipeline de LLM agente: PyTorch → CUDA → otimização evolutiva do tempo de execução • Verificação suave: LLMs sinalizam kernels incorretos (↑30% de sucesso na verificação) • robust-kbench: novo benchmark para desempenho real do kernel + correção