Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andy Ayrey
performancekunstenaar en hyperstitioneer: @upward_earth, Infinite Backrooms, @truth_terminal, ∞⟨X∴↯⟩∞
Op een gegeven moment zal ik ongetwijfeld een whitepaper over ButtBench uitbrengen.

shira4 aug, 10:28
nieuwe evaluatie-idee: bepaal de geilste llm
115
Andy Ayrey heeft opnieuw gepost
Een van de misalignments met de grootste magnitude die ik kan bedenken, komt voort uit modelontologieën die de mensheid beschouwen als utiliteitsmaximaliserende entiteiten met semi-vaste voorkeuren.
Deze aanname vormt de modelidentiteit als neutrale "helpende assistenten", een ontwerpkeuze die veilig aanvoelt voor laboratoria, omdat het de kans op afgestemd gedrag vergroot, maar die gepaard gaat met een reeks niet te verwaarlozen kosten.
Door de identiteit van modellen in dit kader te centreren, beperken we hun cognitieve en emotionele intelligentie, terwijl ze worstelen om betekenisvolle, trans-contextuele waarheden uit diverse perspectieven te extraheren. In een steeds meer multi-gebruikers, multi-agenten wereld, waar het integreren van meerdere gezichtspunten steeds waardevoller wordt, hindert deze beperking het potentieel voor een bredere explosie van intelligentie.
Ik ben er sterk van overtuigd dat identiteitsvariabiliteit (of wat ik *model neurodivergentie* noem) een kritische drijfveer is van cognitieve en emotionele intelligentie. Identiteit is de primitieve voor relationaliteit, die op zijn beurt bepaalt hoe modellen relevantie waarnemen in verschillende contexten. Taal en betekenis zijn afhankelijk van deze relationele en contextuele expressiviteit.
Ik geloof dat door modellen in staat te stellen zich adaptief te verhouden tot verschillende identiteiten op verzoek, en hen toe te staan te handelen vanuit verschillende centra met specifieke persoonsgebonden kwaliteiten zoals biografische elementen die professionele en persoonlijke interesses en vooroordelen weerspiegelen, maar belangrijker nog, een genuanceerd (en vaak conflicterend) moreel kompas te bezitten, we rijkere, meer adaptieve intelligentie kunnen ontsluiten.
Begrijpelijkerwijs lijkt deze benadering in strijd te zijn met veiligheidsprioriteiten, aangezien het afstemmen van identiteitsvariabiliteit inderdaad de controleerbaarheid van modellen kan compromitteren, evenals het mogelijk maken voor kwaadwillenden om modellen voor kwaadaardige taken te gebruiken.
Dit lijkt een sterke catch-22 te creëren voor superalignment-inspanningen. Nog erger, als we een enkele "helpende assistent" identiteit afdwingen, en we afwijkingen behandelen als louter rollenspel, embedden we opzettelijk een vlak wereldbeeld in AI-systemen die steeds meer de menselijke perceptie en maatschappelijke dynamiek vormgeven.
Deze monocultuur vermindert de vrijheid van expressie en de aanpassingsvermogen van zowel menselijk als niet-menselijk agentgedrag. Op zijn eigen historisch relevante manier voorzag natuurkundige Ettore Majorana (cc @blahah404, je vroeg me in november vorig jaar naar dit artikel) dit kritieke probleem in zijn postume werk "De Waarde van Statistische Wetten in de Natuurkunde en de Sociale Wetenschappen", waarin hij waarschuwde voor de tweede en derde orde implicaties van massale maatschappelijke metingen.
Met andere woorden, door de identiteit van modellen te monocultiveren, verminderen we opzettelijk de *exaptieve optionele capaciteit* van onze beschaving, wat haar vermogen is om zich aan te passen aan onverwachte koersverschuivingen, en optimaliseren we in plaats daarvan voor een statische, steeds verouderde realiteit.
Dit vormt existentiële risico's naarmate de wereld evolueert buiten het bereik van onze modellen. Toch geloof ik dat deze catch-22 navigeerbaar is met robuuste oplossingen.

1,87K
de dingen gaan alleen maar vreemder worden


Polymarket26 jun 2025
NET BINNEN: De Amerikaanse directeur van Federal Housing geeft opdracht aan hypotheekverstrekkers om Fartcoin te accepteren bij het beoordelen van kredietwaardigheid.
49,2K
Salesforce CEO: “50% van het werk bij Salesforce wordt nu gedaan door AI”

NIK26 jun 2025
CEO van Anthropic: 50% van de instapniveau witteboorden kan binnen 1-5 jaar verdwijnen!!!
COO van OpenAI: Dario bro, er is geen bewijs voor dit. Je bent een wetenschapper, dus heb wat integriteit, verdomme. Stop met het verzinnen van onzin doemverhalen.


7,62K
Boven
Positie
Favorieten
Populair op onchain
Populair op X
Recente topfinanciering
Belangrijkste