Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Bartosz Naskręcki
Wiskundige | Vice-decaan @ Adam Mickiewicz Universiteit in Poznań|Rigoureuze wiskunde overbruggen met programmeren &ML|Gepassioneerd over wat AI echt begrijpt
Hier presenteer ik een complete auto-formalisering van een recent wiskundig artikel (weer!)
Barańczuk, Stefan. "Het verminderen van het aantal vergelijkingen dat een subset van de n-ruimte over een eindig veld definieert." Annales de la Faculté des sciences de Toulouse : Mathématiques, ser. 6, vol. 33, no. 1 (2024): 177–182.
Ik heb een paar dagen aan dit project gewerkt. Eerst heb ik Aristotle uitgevoerd door @HarmonicMath, dat in ongeveer 15 uur de bewijsvoering volledig auto-geformaliseerd heeft. Daarna, met de geweldige hulp van @PietroMonticone, is het me gelukt om een blauwdrukversie van het bewijs op te zetten. Dit is een versie waarin alle delen van de documentatie in LaTeX interactief worden en kunnen worden geïnspecteerd en bestudeerd. We kunnen de afhankelijkheden in het bewijs zien en hun relaties bestuderen.
In de post-processing fase heb ik ook Grok Heavy en Codex CLI met GPT-5.2 in xhigh-modus gebruikt om een regel-voor-regel analyse van het formele bewijs te schrijven. Dit is een grote hulp voor mensen die geen professionele Lean 4 programmeurs zijn. Je kunt echt alle stappen van het bewijs internaliseren.
Ik wil mijn indrukken samenvatten en wat ik van deze ervaring heb geleerd. @vladtenev @Leonard41111588 @HarmonicMath @llllvvuu @littmath @AlexKontorovich @jdlichtman @KenOno691 @CarinaLHong @gdb @hongyuan_mei




39
Wiskundige artikelen hebben formele validatie nodig. Dit gebeurt meestal informeel door een referee. Maar wat als we konden vertrouwen op iets robuuster zoals auto-formalisatie in Lean 4, waarbij de rol van de referee zou worden verminderd tot het nauwkeurig controleren van de formuleringen van de definities en stellingen? De compilatie van automatisch gegenereerde code zou een bewijs certificaat worden. Dit is wat er gebeurde in een langere run die ik deed met Aristoteles door @HarmonicMath.
Dank aan @PietroMonticone en @llllvvuu voor het helpen met de opzet voor het blauwdruk. Hier presenteer ik een complete correcte auto-formalisatie van een paper van mijn vriend Stefan Barańczuk over Chebyshev deelbaarheidsequenties. De code is ongeveer 5000 regels van zeer niet-triviale Lean. Het corrigeert alle inconsistenties en hiaten in het hoofdartikel (zelfs het bewijzen van enkele gedelegeerde proposities).
Ik ga een serie van dergelijke experimenten posten, die bewijzen dat we in sommige gebieden van de wiskunde, waaronder elementaire getaltheorie, combinatoriek en analyse (alle soorten dingen behandeld door Mathlib), niet ver verwijderd zijn van een massale verschuiving in de documentatie van de geldigheid van bewijzen. Ik denk dat dit een hectisch jaar gaat worden!



77
Als ik vandaag de dag een student was, zou het interactie hebben met state-of-the-art LLM's bijna als vals spelen aanvoelen. Vanmorgen heb ik willekeurig een foto van het schoolbord genomen en ChatGPT-5.2-Pro gevraagd om de context, de oplossing en enkele opmerkingen over de beroemde Chevalley-theorema over constructieve verzamelingen uit te leggen. Wat ik ontving was een opmerkelijk diepgaand rapport, dat hoogwaardig materiaal over algebraïsche geometrie samenvoegde, afkomstig van het hele internet.
Dit roept een serieuze vraag op: wat is de echte inspanning en uitdaging voor studenten vandaag de dag? Kosten zijn zeker een factor, maar zodra toegang tot deze modellen beschikbaar is, hoe zou men dan moeten leren in dit land van overvloed, waar uitleg, referenties en interactieve verkenning allemaal onmiddellijk toegankelijk zijn?
Misschien gaat de strijd niet langer over het verkrijgen van informatie of zelfs het begrijpen van individuele argumenten, maar over het ontwikkelen van oordeel: weten welke vragen te stellen, welke uitleg te vertrouwen, hoe diepte versus oppervlakkige plausibiliteit te herkennen, en hoe ideeën te internaliseren in plaats van ze slechts te consumeren. In een omgeving waar antwoorden overvloedig zijn, kan de echte moeilijkheid liggen in het vormen van smaak, wiskundige intuïtie en de capaciteit om te navigeren - in plaats van te verdrinken in - deze plotselinge overvloed aan kennis.



185
Boven
Positie
Favorieten
