Precisamos de novos benchmarks para soluções de baixa complexidade para problemas de codificação. Cada nova funcionalidade é como um bloco de jenga numa torre, e os benchmarks atuais apenas classificam quão bem cada bloco está montado. Precisamos de avaliações que acompanhem quão alto você pode empilhar os blocos antes que a torre desmorone.