Một điều khiến tôi bực bội trong tuần này là một số phiên bản LLM hoạt động tốt hơn và kém hơn cho một số câu lệnh. Ví dụ, một số (ngay cả trong cùng một gia đình hoặc cùng một phiên bản) liên tục gặp lỗi phân tích trên những thứ mà phần còn lại của các LLM có thể xử lý. Tôi cảm thấy khó chịu, nhưng đã bỏ qua.
15,44K