运行四个高水平的OpenCode代理 + 子代理,使用mlx_lm.server连续批处理和MiniMax M2.5(6位)。 轻松适配512GB M3 Ultra。生成速度相当快。但与云服务器相比,预填充仍然较慢。