Apple presenterar AToken: En enhetlig visuell tokeniserare • Den första tokenisatorn som förenar bilder, videor och 3D • Delat latent 4D-utrymme (bevarar både rekonstruktion och semantik) • Stark över hela generation och förståelse för uppgifter (ImageNet 82,2 %, MSRVTT 32,6 %, 3D acc 90,9 %)