Dessa AI-verktyg verkar bra för det mesta, så varför är de så dåliga på det område där jag är kapabel att bedöma kvalitet?