Chúng tôi đã đánh giá rất nhiều mô hình cơ sở dựa trên các đánh giá perplexity và Kimi k2.5 đã chứng tỏ là mạnh nhất! Sau đó, chúng tôi tiếp tục huấn luyện trước và RL tính toán cao (tăng gấp 4 lần). Sự kết hợp của mô hình cơ sở mạnh, CPT và RL, cùng với các bộ lấy mẫu suy diễn và RL của Fireworks đã làm cho Composer-2 đạt cấp độ tiên phong. Thật là một thiếu sót khi không đề cập đến mô hình cơ sở Kimi trong blog của chúng tôi ngay từ đầu. Chúng tôi sẽ sửa điều đó cho mô hình tiếp theo.