ChatGPT peut facilement réussir un test de Turing... mais seulement si le test est limité à une conversation de 5 minutes. Plus la conversation dure, plus les fissures commencent à apparaître. C'est pourquoi l'avenir des benchmarks de l'IA portera sur les trajectoires. 🧵
38