如果你认为 @Apple 在 AI 方面没有做太多,那你就被聊天机器人热潮蒙蔽了双眼,没有足够关注! 他们刚刚在 @huggingface 上发布了 FastVLM 和 MobileCLIP2。这些模型比之前的工作快了多达 85 倍,体积小了 3.4 倍,使得实时视觉语言模型 (VLM) 应用成为可能!它甚至可以在你的浏览器中 100% 本地进行实时视频字幕生成 🤯🤯🤯
53.83K