nemohl jsem se přenést přes to, proč Zuck zaplatil 15 miliard dolarů za akvizici 15 zaměstnanců ze scaleAI (datová společnost) tak jsem se ponořil do hloubky a myslím, že jsem na to přišel: Nedochází nám data. Ve skutečnosti je to naopak. jediné samořídící auto vyprodukuje 2 TB (to je 800 000 knih) dat za HODINU. problém je v tom, že data jsou nepořádek, který není snadné vložit do LLM k trénování, takže jsou prostě hozena na datový hřbitov, aby to vyřešil někdo jiný (nikdo to nedělá). Vážný nedostatek dobrých datových inženýrů Ten hřbitov, který jsem zmínil výše, je ve skutečnosti zlatý důl, pokud se jím dokážete prokousat Problém je, že jen velmi málo lidí má mozek nebo čas. Hádám, že to je důvod, proč zuck zaplatil 15 miliard dolarů za zaměstnance scaleAI Kvalitnější data jsou mnohem cennější než "množství" dat Zejména u post-trénovacích modelů (např. výpočet doby testu). Vyžaduje také méně výpočetních prostředků, což snižuje náklady na trénování modelů. Pokud tedy váš tréninkový tým může 1. Seřaďte vysoce kvalitní data 2. Vstříkněte jej do po tréninku a 3. Snižte náklady - vyhrajete závod o umělou inteligenci (k nezaplacení).
1,55K