GAUSS: Matematiikan taustalla olevien strukturoitujen taitojen yleinen arviointi Olemme innoissamme voidessamme julkaista GAUSS:n, seuraavan sukupolven matematiikan tekoälyn vertailuarvon, joka on rakennettu voittamaan alhaisen osaamisen resoluution rajoitukset nykypäivän vertailuarvoissa. Toiminta GAUSS profiloi LLM:t 12 kognitiivisen taidon ulottuvuudessa, jotka kattavat tiedon, päättelyn, oppimisen ja luovuuden, tarjoten tarkan ja kattavan kuvan mallien matemaattisista kyvyistä. Miksi sillä on merkitystä Paljastamalla vahvuudet ja heikkoudet hienorakeisella tasolla GAUSS luo perustan matemaattisen tekoälyn etenemiselle pintatason hahmontunnistuksesta kohti aitoa päättelyä ja ymmärrystä. Mitä löysimme Soveltamalla GAUSSia GPT-5-ajatteluun opimme: ✅ Vahva taksonomian muistamisessa, argumenttien arvioinnissa, uskottavuuden tarkistamisessa, edistyneiden papereiden yhteenvedoissa ja ongelmien esittämisessä ❌ Heikko lauseen soveltamisessa, symbolisessa laskennassa, ongelmanratkaisustrategioiden soveltamisessa, geometrisessa intuitiossa ja yleistyksessä. Mitä seuraavaksi Rakennamme kuratoituja ongelmajoukkoja, joissa on rubriikkeja yhteisön joukkoistamisen, LLM-tutkintojen taitokaavioiden ja tekoälyn automaattisen arvioinnin avulla, jotka ovat perusta matematiikan superälykkyyden mallikoulutukselle. Kutsumme kaikki lämpimästi liittymään GAUSS-yhteisöön, osallistumaan ongelmiin portaalimme kautta ja auttamaan muokkaamaan Math AI:n tulevaisuutta! Tätä työtä johdatimme minä ja Jiaxin Zhang (@JiaxinZhang626) @hyperbolic_labs / @Caltech yhdessä Qiuyu Renin ja Tahsin Saffatin kanssa @UCBerkeley, Lily Liun (@eqhylxx) @UCBerkeley → nyt @OpenAI, Zitong Yangin (@ZitongYang0) @Stanford, professori Banghua Zhun (@BanghuaZ) @nvidia / @UW ja professori Yi Man (@YiMaTweets) kanssa @UCBerkeley / @HKUniversity. Linkit ja yksityiskohdat alla 👇 (1/n)