ChatGPT puede pasar fácilmente una prueba de Turing... pero solo si la prueba se limita a una conversación de 5 minutos. Cuanto más larga sea la conversación, más grietas comienzan a aparecer. Por eso, el futuro de los benchmarks de IA se centrará en las trayectorias. 🧵
7