預言原則:如果一個代理被訓練以最小化其自身觀察的預測損失,並且它可以觀察自己的預測,那麼它所做的每一個預測必然也會成為一個目標。