Một mô hình lý luận mở mới, K2-Think, vừa được phát hành với điểm số tương đương với GPT-OSS 120B và nhận được nhiều sự chú ý từ truyền thông. Tuy nhiên, hiệu suất của họ phụ thuộc vào việc đánh giá sai lầm, bị ô nhiễm, so sánh không công bằng và trình bày sai kết quả. 🧵