Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

samsja
Ledende forskning ved @PrimeIntellect
Neste generasjon av 10B+ verdivurderingsproduktoppstart vil bli bygget ved å skalere opplæring på internt RL-miljø
Vi lever i en overflod av muligheter, og likevel har vi bare to store AI-produkter, chatgpt og kodeagent, og det frustrerer meg dypt
Den nåværende forsyningskjeden for kunstig intelligens er strukturelt ødelagt med en maskinvareleverandør, et par gigantiske AI-spillere som eier alt etterretningsraffineriet, utviklere sitter igjen med api-tilgang med knapt ingen kontroll
Som om internett-æraen ble bygget med Intel som solgte CPU til 4 gigantiske skyer som eier hele infrastrukturen og programvarestabelen med hemmelighet og nda over alt og gir wordpress som et utviklingssett til oppstart
Hvorfor oppfant ikke forvirring dyp forskning? De kunne bare ikke fordi det er trene med RL
Min spådom for de neste årene:
RL vil bli det kraftigste verktøysettet for oppstartsbygging av AI-produkter. Vi vil se hundrevis av suksesshistorier som markør og elskelig. Sluttbrukeren vil ha mest nytte av det
Store laboratorier vil utvikle seg mot produktselskap, oai vil fokusere på forbrukermarkedet, Antropic på kodeagent, deepmind vil integrere AI i alle Google-virksomheter, meta og XAI kjemper om sosiale medier
Vi vil se fremveksten av et økosystem av oppstart av AI-infrastruktur, salg av databehandling, opplæringsgrunnmodell, kuratering av data, bygging av RL-miljø, tilbud om billig slutning og opplæring, drevet av åpen vitenskap og åpen kildekode-programvare.
@PrimeIntellect er banebrytende for dette økosystemet og visjonen om åpen kildekode-agi, er RL-miljøhuben en av de første nøkkelbrikkene

Prime Intellect7 timer siden
Vi presenterer miljøhuben
RL-miljøer er den viktigste flaskehalsen for neste bølge av AI-fremgang, men store laboratorier låser dem ned
Vi bygde en fellesskapsplattform for crowdsourcing av åpne miljøer, slik at alle kan bidra til AGI med åpen kildekode
3,08K
samsja lagt ut på nytt
14 dager med utdeling, dag 7!
Møt Sami Jaghouar (@samsja19) fra @PrimeIntellect:
Sami leder forskningen deres og fokuserer på desentralisert fortrening og distribuert forsterkende læring som en del av arbeidet sitt.
Sami skal holde et foredrag om hvordan implementering av desentralisert opplæring ser ut på Prime.

7,89K
Siste hackathon i GPU-modus var det beste hackathonet jeg noen gang har deltatt på personlig, og gleder meg til det neste

Mark Saroufim23. aug., 05:09
Det er igjen tid for vår siste (nå årlige) feiringsekstravaganza for året. GPU MODE møtes IRL igjen i sentrum av San Francisco fredag 24 oktober fra 10 til 22 for å hacke hele dagen

3,59K
Ser ut til at andre mennesker konvergerer til å bruke vllm v1 logprob for viktighetsforholdet for å fikse stabilitetsproblemet.
Jeg tror jeg har ptsd fra denne typen rl-krasj

Zichen Liu22. aug., 23:35
Med bare noen få linjer med kode løste Fengs (@fengyao1909) foreslåtte løsning – å bruke viktighetssampling på atferdspolicyen – treningsustabiliteten i mitt tilfelle (havre). Jeg tror resultatet kan generaliseres til andre RL-rammeverk også. Flott arbeid, Feng!

6,72K
Jeg ansetter forskningsingeniør ved @PrimeIntellect
Vi bygger en åpen kildekode agi labs og leter etter rå talent. Vi bryr oss ikke om din tidligere stillingstittel.
Alle i forskerteamet er fullstack, vi bygger infrastruktur og ser også på data. Hvis du har et sweet spot for system, forsterkende læring, data eller skaleringsjuss, vil du bli servert massevis av utfordringer å løse
83,21K
Topp
Rangering
Favoritter
Trendende onchain
Trendende på X
Nylig toppfinansiering
Mest lagt merke til