SakanaAI präsentiert robuste agentische CUDA-Kernel-Optimierung • Fusioniert Operationen, beschleunigt Vorwärts-/Rückwärtsdurchläufe, übertrifft Torch-Baselines • Agentische LLM-Pipeline: PyTorch → CUDA → evolutionäre Laufzeitoptimierung • Soft-Verifizierung: LLMs kennzeichnen inkorrekte Kerne (↑30% Verifizierungsquote) • robust-kbench: neuer Benchmark für reale Kernel-Leistung + Korrektheit