Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

jack morris
@cornell @meta penelitian // model bahasa, teori informasi, ilmu AI
menemukan cara "membatalkan" RL dan mengubah gpt-oss kembali menjadi model dasar
akan menurunkan beban besok
Gn


jack morris9 Agu, 03.21
penasaran dengan data pelatihan model gpt-oss baru OpenAI? Saya juga.
Jadi saya menghasilkan 10 juta contoh dari gpt-oss-20b, menjalankan beberapa analisis, dan hasilnya adalah... cukup aneh
Saatnya menyelam 🧵 lebih dalam

29,69K
Oke, butuh bantuan! mencoba menyempurnakan GPT-OSS selama akhir pekan. ini bekerja selama ~100 langkah, lalu melemparkan kesalahan CUDA kehabisan memori
Dugaan saya adalah bahwa seringkali, semua token dialihkan ke satu ahli. Kemudian pelatihan crash.
Apakah ada perbaikan yang mudah? belum pernah menyempurnakan MoE sebelumnya
23,69K
Model mana yang harus kita lakukan selanjutnya?

jack morris9 Agu, 03.21
penasaran dengan data pelatihan model gpt-oss baru OpenAI? Saya juga.
Jadi saya menghasilkan 10 juta contoh dari gpt-oss-20b, menjalankan beberapa analisis, dan hasilnya adalah... cukup aneh
Saatnya menyelam 🧵 lebih dalam

21,75K
penjelasan terpendek tentang GPT-5: inilah yang diprediksi oleh hukum penskalaan!
Modelnya lebih baik, pengembaliannya berkurang, dan sayangnya peningkatan kecerdasan umum mutlak hanya akan menjadi lebih kecil
Kabar baiknya adalah masih banyak yang harus dilakukan. Kepribadian, penalaran, ingatan, dan kreativitas masih menjadi masalah terbuka
26,52K
dunia VC memberikan banyak nilai tetapi terkadang terasa seperti mereka hanya membakar uang.
beberapa startup yang saya kenal mengumpulkan total ~ 100 juta tiga tahun lalu untuk membuat AI, membangun perangkat lunak yang tidak pernah digunakan oleh siapa pun, dan sekarang mereka semua bekerja di tempat lain untuk hal-hal yang tidak terkait.
Ke mana semua uang itu pergi?
18,43K
aneh di era media sosial untuk merasa bahwa semua orang sedang mengerjakan ulasan & bantahan NeurIPS tetapi tidak ada yang membicarakannya secara publik.
Saya berkontribusi pada tiga bantahan. Salah satu dari ketiganya sangat membuat frustrasi.
Siapa lagi yang mengerjakan bantahan? Bagaimana kabarmu?
12,69K
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal