no podía entender por qué zuck pagó $15B para adquirir 15 empleados de scaleAI (empresa de datos) así que investigué a fondo y creo que lo descubrí: No nos estamos quedando sin datos. De hecho, es todo lo contrario. un solo coche autónomo produce 2TB (eso son 800,000 libros) de datos POR HORA. el problema es que esos datos son un desastre, no son fáciles de alimentar en un LLM para entrenar, así que simplemente se tiran a un cementerio de datos para que alguien más lo resuelva (nadie lo hace). Escasez severa de buenos ingenieros de datos Ese cementerio que mencioné arriba es en realidad una mina de oro si puedes clasificarlo el problema es que muy pocas personas tienen la inteligencia o el tiempo. Supongo que por eso zuck pagó $15B por los empleados de scaleAI Los datos de mayor calidad son mucho más valiosos que la "cantidad" de datos Especialmente para modelos post-entrenamiento (por ejemplo, computación en tiempo de prueba). también requiere menos computación, lo que reduce el costo de entrenar modelos. así que si tu equipo de entrenamiento puede 1. Clasificar datos de alta calidad 2. Inyectarlos en el post-entrenamiento y 3. Reducir costos - vas a ganar la carrera de la IA (invaluable).
1.62K