Cerebras 本周一直在展示其以非常高的速度托管大型 MoE 的能力,以 >1,500 个输出令牌/秒的速度推出 Qwen3 235B 2507 和 Qwen3 Coder 480B 端点 ➤ @CerebrasSystems 现在为 Qwen3 235B 2507 推理和非推理提供端点。两种型号的总参数均为 235B,其中 22B 处于活动状态。 ➤ Qwen 3 235B 2507 Reasoning 提供可与 o4-mini(高)和 DeepSeek R1 0528 相媲美的智能。非推理变体提供的智能可与 Kimi K2 相媲美,远高于 GPT-4.1 和 Llama 4 Maverick。 ➤ Qwen3 Coder 480B 总参数为 480B,其中 35B 处于活动状态。该模型对于代理编码特别强大,可用于各种编码代理工具,包括 Qwen3-Coder CLI。 Cerebras 的发布代表了这种智能水平首次以这样的输出速度实现,并有可能解锁新的用例——例如为代理的每个步骤使用推理模型,而无需等待几分钟。
25.12K