SakanaAI giới thiệu Tối ưu hóa Kernel CUDA Agentic Robus • Kết hợp các phép toán, tăng cường các bước tiến/lùi, vượt trội hơn các tiêu chuẩn torch • Quy trình LLM Agentic: PyTorch → CUDA → tối ưu hóa thời gian chạy tiến hóa • Xác minh mềm: LLM phát hiện các kernel không chính xác (↑30% tỷ lệ thành công xác minh) • robust-kbench: tiêu chuẩn mới cho hiệu suất kernel thực tế + độ chính xác