Meu post inaugural @delphi_intel é sobre Gen AI Video Models. Resumo abaixo (1/10) 👇 s/o para @moonshot6666 por seu feedback sobre este ensaio & @PJaccetturo para este vídeo hype dope eu vou descaradamente roubar. TLDR: os vídeos estão 2-3 anos atrasados em relação ao texto. Eles estão ficando muito bons, muito rápidos
1. Os humanos são criaturas visuais. A modalidade de conteúdo da Gen AI provavelmente tenderá a uma distribuição semelhante à da web:
2. Mercado é grande: >US$ 40b + bilhões até 2030 (com adjacências relevantes). A disrupção no marketing, entretenimento e educação é óbvia, mas também implicações claras na robótica, vigilância e tarefas de agente de longo prazo
3. A paisagem tem muita concorrência entre pilhas Inclui empresas de modelos, aplicativos multimodais, avatares falantes, sincronização labial e muito mais. Sem falar em toda a infraestrutura necessária para alimentar verdadeiros modelos e aplicativos multimodais. s/o para @venturetwins e @a16z para o mapa
4. Oriente vs. Ocidente. A corrida está amplamente dividida entre os EUA e a China. Em modelos de vídeo, a China lidera (9 dos 15 melhores modelos) s/o @ArtificialAnlys
6. Big Tech Advantage: canalizar esses novos recursos para ecossistemas de usuários >1b será um alto ROI Com base nos atributos abaixo, não é chocante que grandes jogadores como $Goog, $meta, $techy, $baba e Bytedance estejam bem posicionados.
7. Acumulação de valor: Ao mesmo tempo, vemos áreas em toda a pilha - particularmente em infra e apps - onde novos entrantes podem criar grandes negócios (Sim, você precisará ler o relatório real para qualquer alpha, preguiçoso)
8. Verdadeira multimodalidade Hoje, os modelos de vídeo parecem um brinquedo. Mas os dados de vídeo e as simulações são uma entrada cada vez mais essencial para tarefas longas e agentivas e para dar início à revolução da robótica. Os modelos de vídeo podem ser a faísca.
468