Questo è come dovrebbero apparire i benchmark per la maggior parte delle integrazioni AI. L'obiettivo non è zero errori, ma significativamente meno errori rispetto a un sistema solo umano. Ben fatto!