أحد الإحباطات التي واجهتها هذا الأسبوع هو أن بعض إصدارات LLM تعمل بشكل أفضل وأسوأ بكثير بالنسبة لبعض المطالبات. على سبيل المثال ، كان لدى البعض (حتى في نفس العائلة أو نفس الإصدار) خطأ في التحليل باستمرار على الأشياء التي يمكن لبقية LLMs التعامل معها. لقد انزعجت ، لكنني تجاهلت الأمر.
‏‎16.28‏K