ChatGPT può facilmente superare un test di Turing... ma solo se il test è limitato a una conversazione di 5 minuti. Più lunga è la conversazione, più iniziano a mostrarsi le crepe. Ecco perché il futuro dei benchmark dell'IA riguarderà le traiettorie. 🧵
16