Apple presenta AToken: un tokenizador visual unificado • Primer tokenizador que unifica imágenes, videos y 3D • Espacio latente 4D compartido (conserva tanto la reconstrucción como la semántica) • Fuerte en todas las generaciones y tareas de comprensión (ImageNet 82.2%, MSRVTT 32.6%, 3D acc 90.9%)