L'audio conversazionale non è solo più dati vocali. Ha una struttura completamente diversa: • Cambio di turno • Parlanti sovrapposti • Pause di silenzio • Interruzioni • Ritmo variabile Molti pipeline di valutazione ASR sono stati progettati per audio pulito a singolo parlante.