- OpenAI:s modell löste alla 12 av 12 problem vid ICPC World Finals. - Googles Gemini 2.5 Deep Think löste 10/12. - Det bästa mänskliga laget fick 11/12. GPT-5 löste också 11/12, och en experimentell resonemangsmodell löste det svåraste problemet. Konkurrenskraftig programmering skiljer sig ganska mycket från att bygga storskaliga system eller skriva produktionskod. Jag skulle gärna se fler benchmarks som återspeglar verkliga programvaruutvecklingsuppgifter.