@OpenAI 的 GPT-OSS 20b 在 @GroqInc 上的表现值得注意 - 383 毫秒的请求时间对于人类来说已经非常接近即时体验。 而且这并不是一个完全简单的案例 - 这是一个简单的结构化数据提取案例。 Logfire 公共追踪在这里:
7.67K