Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

jack morris
výzkum @cornell @meta // jazykové modely, teorie informace, věda o umělé inteligenci
Dobře, potřebuji pomoc! O víkendu jsem se pokusil doladit GPT-OSS. funguje pro ~100 kroků, pak vyvolá chybu CUDA z nedostatku paměti
Můj odhad je, že jednou za čas jsou všechny tokeny směrovány k jedinému expertovi. Pak trénink spadne.
Existuje snadné řešení? nikdy předtím jsem žádné MoE nevyladil
4,39K
Který model bychom měli udělat příště?

jack morris9. 8. 03:21
Zajímají vás trénovací data nových modelů GPT-OSS od OpenAI? Já jsem byl také.
tak jsem vygeneroval 10M příkladů z gpt-oss-20b, provedl nějakou analýzu a výsledky byly... Docela bizarní
Je čas na hluboký ponor 🧵

21,29K
svět VC poskytuje velkou hodnotu, ale někdy to vypadá, jako by právě zapálili peníze.
několik startupů, které znám, získalo před třemi lety celkem ~100 milionů na výrobu AI, vytvořilo software, který nikdo nikdy nepoužil, a nyní všechny pracují jinde na nesouvisejících věcech.
Kam se poděly všechny ty peníze?
18,42K
Strávil jsem posledních pár hodin rozhovorem s GPT-OSS a mohu s jistotou říci, že se nepodobá žádnému modelu, který jsem testoval
V jednu chvíli je to pro mě programování na profesionální úrovni, v další je to vymýšlení si základních faktů a lpění na nich, ať říkám, co říkám
děje se něco velmi podivného
32,3K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější