SakanaAI 提供强大的代理 CUDA 内核优化 • 融合操作,提升前向/反向传递,超越 torch 基准 • 代理 LLM 流程:PyTorch → CUDA → 进化运行时优化 • 软验证:LLM 标记不正确的内核(↑30% 验证成功率) • robust-kbench:新的真实内核性能 + 正确性基准