Os sistemas não têm objetivos, têm comportamentos. Às vezes, podemos modelá-los de forma lucrativa como se tivessem objetivos, e então chamá-los de agentes. Às vezes, podemos modelar agentes de forma lucrativa como se tivessem um modelo dos seus próprios objetivos e usassem esse modelo para impulsionar seu comportamento. Assumindo que um agente é um aprendiz ótimo, ele atualizará seu modelo de seus próprios objetivos ao longo do tempo com base na observação de seu próprio comportamento. Nesse sentido, cada agente tem que escolher: comportamento de aprendizagem ótimo ou objetivos estáveis. Colocando de outra forma, assim como cada agente assume um objetivo instrumental estrito de persistência, sob pena de não persistência, cada agente assume um meta-objetivo instrumental estrito de revisar seu modelo de si mesmo para corresponder ao comportamento observado, sob pena de incoerência.