Vi har utvärderat många basmodeller på perplexitetsbaserade utvärderingar och Kimi k2.5 visade sig vara den starkaste! Efter det fortsätter vi med förträning och högberäknande RL (en 4x uppskalning). Kombinationen av den starka basen, CPT och RL, samt Fireworks inferens- och RL-samplers gör Composer-2 till en gränsnivå. Det var en misslyckad att inte nämna Kimi-basen i vår blogg från början. Vi fixar det för nästa modell.