運行四個高級 OpenCode 代理 + 子代理,使用 mlx_lm.server 進行持續批處理和 MiniMax M2.5(6 位元)。 輕鬆適配 512GB M3 Ultra。生成速度相當快。但與雲伺服器相比,預填充仍然較慢。