System har inga mål, de har beteenden. Vi kan ibland på ett lönsamt sätt modellera dem som att de har mål och sedan kalla systemen för agenter. Vi kan ibland på ett lönsamt sätt modellera agenter som att de har en modell av sina egna mål och använder den modellen för att driva sitt beteende. Förutsatt att en agent är en optimal elev kommer den att uppdatera sin modell av sina egna mål över tid baserat på att observera sitt eget beteende. I denna mening måste varje agent välja: optimalt inlärningsbeteende eller stabila mål. Med andra ord, precis som varje agent tar på sig ett strikt instrumentellt mål av uthållighet, på grund av hot om icke-persistens, tar varje agent på sig ett strikt instrumentellt metamål att revidera sin självmodell för att matcha observerat beteende, på grund av inkoherens.