non riuscivo a capire perché zuck avesse pagato 15 miliardi di dollari per acquisire 15 dipendenti di scaleAI (azienda di dati) quindi ho approfondito e penso di aver capito: Non stiamo esaurendo i dati. In realtà è il contrario. una singola auto a guida autonoma produce 2TB (cioè 800.000 libri) di dati ALL'ORA. il problema è che i dati sono un disastro, non è facile alimentarli in un LLM per addestrarlo, quindi vengono semplicemente gettati in un cimitero di dati per qualcun altro da risolvere (nessuno lo fa). Severa scarsità di buoni ingegneri dei dati Quel cimitero di cui ho parlato sopra è in realtà una miniera d'oro se riesci a setacciarlo il problema è che pochissime persone hanno il cervello o il tempo. Suppongo che sia per questo che zuck ha pagato 15 miliardi per i dipendenti di scaleAI Dati di qualità superiore sono molto più preziosi della "quantità" di dati Soprattutto per i modelli post-addestramento (ad es. calcolo durante il test). richiede anche meno calcolo, il che riduce i costi per addestrare i modelli. quindi se il tuo team di addestramento può 1. Ordinare dati di alta qualità 2. Iniettarli nel post-addestramento e 3. Ridurre i costi - vincerai la corsa all'AI (inestimabile).
1,61K