FLUX.1 Kontext a fost SUPRAÎNCĂRCAT! @NVIDIA_AI_PC Accelerarea TensorRT oferă o inferență de 2 ori mai rapidă pe GPU-urile RTX. Cuantizarea reduce memoria de la 24 GB la 7 GB (FP4), menținând în același timp calitatea. Variantele BF16/FP8/FP4 gata de producție sunt acum disponibile @huggingface