No querrás perderte esto: todos los trucos y optimizaciones utilizados para hacer que gpt-oss sea increíblemente rápido, todo ello en una publicación de blog (¡con benchmarks)! 🔥 Cubrimos detalles que van desde la cuantización MXFP4 hasta núcleos preconstruidos, paralelismo Tensor/Experto, procesamiento continuo por lotes y mucho más. Bonus: ¡Añadimos extensos benchmarks (junto con scripts reproducibles)! ⚡