Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Minulý týden se naše modely uvažování zúčastnily mezinárodní soutěže v programování na vysoké škole (ICPC) 2025, přední světové soutěže v programování na univerzitní úrovni. Náš systém vyřešil všech 12 z 12 problémů, což je výkon, který by se umístil na prvním místě na světě (nejlepší lidský tým vyřešil 11 problémů).
Tento milník završuje intenzivní 2 měsíce soutěžních vystoupení našich modelek:
- Druhé místo ve světovém finále AtCoder Heuristics
- Zlatá medaile na Mezinárodní matematické olympiádě
- Zlatá medaile na Mezinárodní olympiádě v informatice
- A nyní zlatá medaile, první místo na světovém finále ICPC.
Věřím, že tyto výsledky, pocházející z rodiny modelů obecného uvažování zakořeněných v našem hlavním výzkumném programu, jsou možná nejjasnějším měřítkem pokroku v tomto roce. Tyto soutěže jsou skvělými samostatnými, časově ohraničenými testy schopnosti objevovat nové nápady. Ještě předtím, než naše modely začaly být zběhlé v jednoduché aritmetice, jsme na tyto soutěže pohlíželi jako na milníky pokroku směrem k transformativní umělé inteligenci.
Naše modely se nyní řadí mezi nejlepší lidi v těchto oblastech, když jsou jim položeny dobře specifikované otázky a jsou omezeny na ~5 hodin. Výzvou je nyní posun k otevřenějším problémům a mnohem delším časovým horizontům. Tato úroveň schopnosti uvažování, aplikovaná po měsíce a roky na problémy, na kterých skutečně záleží, je to, o co nám jde – automatizace vědeckých objevů.
Tento rychlý pokrok také podtrhuje význam výzkumu bezpečnosti a souladu. Stále potřebujeme lépe porozumět vlastnostem zarovnání dlouhodobých modelů uvažování; zejména doporučuji zhodnotit fascinující zjištění ze studie o intrikách v modelech uvažování, kterou jsme dnes zveřejnili (
Gratuluji svým kolegům z týmu, kteří vylili svá srdce do získání těchto soutěžních výsledků, a všem, kteří přispěli k základnímu základnímu výzkumu, který jim to umožňuje!
Top
Hodnocení
Oblíbené