Apple FastVLM-7B Efektywne kodowanie wizji dla modeli językowych wizji większe warianty wykorzystujące Qwen2-7B LLM przewyższają ostatnie prace, takie jak Cambrian-1-8B, używając jednego enkodera obrazu z 7,9x szybszym TTFT kodowanie vibe aplikacji do podpisywania wideo z nim w anycoder