O ChatGPT pode passar facilmente em um teste de Turing... mas apenas se o teste fosse limitado a uma conversa de 5 minutos. Quanto mais longa a conversa, mais rachaduras começam a aparecer. É por isso que o futuro dos benchmarks de IA será sobre trajetórias. 🧵
48