los modelos de demanda se crearon para humanos que conectaban APIs unas pocas veces por minuto... Max Pero millones de agentes nunca duermen, nunca agrupan, nunca esperan Ejecutan inferencias de forma continua, a través de todas las zonas horarias, sin tolerancia para mantenerse en línea AWS no puede construir centros de datos lo suficientemente rápido para la demanda humana. Ni siquiera valoran lo que los agentes hacen con esa curva Que sea hora de actualizar los modelos es quedarse corto