É assim que os benchmarks devem parecer para a maioria das integrações de AI. O objetivo não é ter zero erros, mas sim ter significativamente menos erros do que um sistema apenas humano. Bem feito!