una segunda pregunta que tengo es qué tan confiables son los datos demográficos autoinformados. Porque ~50% de los mensajes de ChatGPT enviados por usuarios menores de 26 años es una estadística increíblemente poderosa si se mantiene en 700 millones de WAU.
una pregunta que tengo sobre el documento de NBER es qué efecto tiene excluir a los usuarios que optan por no permitir que sus datos se utilicen para el entrenamiento. Las personas que usan ChatGPT para trabajar y/o codificar tienen que ser mucho más propensas a optar por no participar que los usuarios ocasionales. ¿Qué impacto tiene este sesgo de muestreo, si es que tiene alguno?
Cuando OAI lanzó la nueva generación de imágenes y Studio Ghibli estaba de moda, los mensajes de los consumidores etiquetados como "multimedia" pasaron del 4% de participación a más del 12% de participación en 28 días consecutivos.