Järjestelmillä ei ole tavoitteita, niillä on käyttäytymistä. Voimme joskus kannattavasti mallintaa ne tavoitteiksi ja sitten kutsua järjestelmiä agenteiksi. Voimme joskus kannattavasti mallintaa agentteja niin, että heillä on malli omista tavoitteistaan ja että he käyttävät tätä mallia käyttäytymisensä ohjaamiseen. Olettaen, että agentti on optimaalinen oppija, se päivittää omien tavoitteidensa mallia ajan myötä oman käyttäytymisensä tarkkailun perusteella. Tässä mielessä jokaisen toimijan on valittava: optimaalinen oppimiskäyttäytyminen tai vakaat tavoitteet. Toisin sanoen, aivan kuten jokainen toimija ottaa tiukan instrumentaalisen tavoitteen pysyvyydestä, jokainen toimija ottaa itselleen tiukan instrumentaalisen metatavoitteen tarkistaa minämallinsa vastaamaan havaittua käyttäytymistä, epäjohdonmukaisuuden tuskalla.