tidak bisa melupakan mengapa zuck membayar $15 miliar untuk mengakuisisi 15 karyawan dari scaleAI (perusahaan data) jadi saya menyelam lebih dalam dan pikir saya mengetahuinya: Kami tidak kehabisan data. Sebenarnya justru sebaliknya. satu mobil swakemudi menghasilkan data senilai 2TB (yaitu 800.000 buku) PER JAM. masalahnya adalah bahwa data berantakan, tidak mudah untuk dimasukkan ke dalam LLM untuk dilatih sehingga hanya dibuang ke kuburan data untuk diselesaikan oleh orang lain (tidak ada yang melakukannya). Kelangkaan insinyur data yang baik Kuburan yang saya sebutkan di atas sebenarnya adalah tambang emas jika Anda dapat memilah-milahnya masalahnya adalah sangat sedikit orang yang memiliki otak atau waktu. Menebak inilah mengapa zuck membayar $15 miliar untuk karyawan scaleAI Data berkualitas lebih tinggi jauh lebih berharga daripada "jumlah" data Terutama untuk model pasca-pelatihan (misalnya komputasi waktu pengujian). Ini juga membutuhkan lebih sedikit komputasi yang mengurangi biaya untuk model pelatihan. Jadi jika tim pelatihan Anda bisa 1. Urutkan data berkualitas tinggi 2. Suntikkan ke dalam pasca pelatihan dan 3. Kurangi biaya - Anda akan memenangkan perlombaan ai (tak ternilai harganya).
1,58K