Системы не имеют целей, у них есть поведения. Мы иногда можем выгодно моделировать их как имеющие цели, а затем называть системы агентами. Мы иногда можем выгодно моделировать агентов как имеющих модель своих собственных целей и использующих эту модель для управления своим поведением. Предполагая, что агент является оптимальным обучающимся, он будет обновлять свою модель своих собственных целей со временем, основываясь на наблюдении за своим поведением. В этом смысле каждый агент должен выбирать: оптимальное поведение обучения или стабильные цели. Иными словами, так же как каждый агент принимает строгую инструментальную цель настойчивости, под угрозой ненастойчивости, каждый агент принимает строгую инструментальную мета-цель пересмотра своей само-модели, чтобы она соответствовала наблюдаемому поведению, под угрозой несогласованности.