Minulý týden se naše modely uvažování zúčastnily mezinárodní soutěže v programování na vysoké škole (ICPC) 2025, přední světové soutěže v programování na univerzitní úrovni. Náš systém vyřešil všech 12 z 12 problémů, což je výkon, který by se umístil na prvním místě na světě (nejlepší lidský tým vyřešil 11 problémů). Tento milník završuje intenzivní 2 měsíce soutěžních vystoupení našich modelek: - Druhé místo ve světovém finále AtCoder Heuristics - Zlatá medaile na Mezinárodní matematické olympiádě - Zlatá medaile na Mezinárodní olympiádě v informatice - A nyní zlatá medaile, první místo na světovém finále ICPC. Věřím, že tyto výsledky, pocházející z rodiny modelů obecného uvažování zakořeněných v našem hlavním výzkumném programu, jsou možná nejjasnějším měřítkem pokroku v tomto roce. Tyto soutěže jsou skvělými samostatnými, časově ohraničenými testy schopnosti objevovat nové nápady. Ještě předtím, než naše modely začaly být zběhlé v jednoduché aritmetice, jsme na tyto soutěže pohlíželi jako na milníky pokroku směrem k transformativní umělé inteligenci. Naše modely se nyní řadí mezi nejlepší lidi v těchto oblastech, když jsou jim položeny dobře specifikované otázky a jsou omezeny na ~5 hodin. Výzvou je nyní posun k otevřenějším problémům a mnohem delším časovým horizontům. Tato úroveň schopnosti uvažování, aplikovaná po měsíce a roky na problémy, na kterých skutečně záleží, je to, o co nám jde – automatizace vědeckých objevů. Tento rychlý pokrok také podtrhuje význam výzkumu bezpečnosti a souladu. Stále potřebujeme lépe porozumět vlastnostem zarovnání dlouhodobých modelů uvažování; zejména doporučuji zhodnotit fascinující zjištění ze studie o intrikách v modelech uvažování, kterou jsme dnes zveřejnili ( Gratuluji svým kolegům z týmu, kteří vylili svá srdce do získání těchto soutěžních výsledků, a všem, kteří přispěli k základnímu základnímu výzkumu, který jim to umožňuje!