- O modelo da OpenAI resolveu todos os 12 dos 12 problemas nas Finais Mundiais do ICPC. - Gemini 2.5 Deep Think do Google resolvido em 12/10. - A melhor equipe humana conseguiu 11/12. O GPT-5 também resolveu 11/12, e um modelo de raciocínio experimental resolveu o problema mais difícil. A programação competitiva é bem diferente de construir sistemas em grande escala ou escrever código de produção. Eu adoraria ver mais benchmarks que reflitam as tarefas de engenharia de software do mundo real.