Je wilt dit NIET missen - Alle trucs en optimalisaties die zijn gebruikt om gpt-oss razendsnel te maken, alles - in een blogpost (met benchmarks)! 🔥 We behandelen details variërend van MXFP4-kwantisatie tot, vooraf gebouwde kernels, Tensor/Expert Parallelisme, Continue Batching en nog veel meer. Bonus: We voegen uitgebreide benchmarks toe (samen met reproduceerbare scripts)! ⚡