SakanaAI 提供強大的代理 CUDA 內核優化 • 融合操作,提升前向/反向傳遞,超越 torch 基準 • 代理 LLM 流程:PyTorch → CUDA → 進化運行時優化 • 軟驗證:LLM 標記不正確的內核(↑30% 驗證成功率) • robust-kbench:新的真實內核性能 + 正確性基準