Penalti kompleksitas berarti strategi optimal untuk game tertentu tidak dapat memiliki kedalaman rekursi tak terbatas kecuali jika dioptimalkan untuk panggilan ekor, atau menghasilkan hadiah eksponensial. Setiap pemisahan rekursif menambahkan setidaknya satu sedikit kerumitan pada model yang diluncurkan waktu strategi.
Sebagian besar teori permainan yang saya lihat tidak bergulat dengan implikasi dari ini. Ini adalah batas yang berbeda dari biaya komputasi belaka. Biaya perhitungan dapat dihargai secara lokal, tetapi kompleksitas adalah batas global. Konteksnya penting.
(Jika Anda mengetahui teori permainan mengingat perilaku pemain yang tidak digulung waktu sebagai model yang akurasi dan kompleksitasnya harus seimbang, beri tahu saya! Saya telah mencari dan tidak menemukan, tetapi itu tidak berarti saya menggunakan kata kunci yang tepat...)
Ini mengatakan bahwa strategi optimal untuk pemain ditentukan relatif terhadap model diri pemain. Jika Anda mencontohkan diri Anda sebagai memilih dua opsi dalam kondisi tertentu, pohon yang tidak digulung tumbuh. Tetapi jika Anda membulatkannya menjadi nol, maka pohon itu tidak mendapatkan cabang baru.
Akibatnya, ada "anggaran keputusan". Menambahkan keputusan yang lebih halus di sini berarti Anda harus membuat keputusan yang tidak terlalu halus di tempat lain. Tidak kurang komputasi, tetapi lebih sedikit keputusan. Atau dengan kata lain, ini adalah biaya kompleksitas dari opsi yang tidak diambil.
Setara dengan "komputasi yang lebih murah" di sini adalah "latar belakang sebelumnya yang lebih baik". Berapa banyak keputusan yang Anda buat adalah perbedaan antara perilaku Anda berdasarkan keadaan saat ini, vs perilaku Anda jika itu adalah (model Anda) momen pengalaman rata-rata. Kebiasaan baik!
Ini seperti cermin pengetahuan umum ... itu tindakan umum. Tindakan masa lalu yang biasa dilakukan oleh agen membatasi tindakan optimal di masa depan. Yang berarti, dalam arti tertentu, hanya biasanya-bertindak-entah bagaimana adalah pra-komitmen yang kredibel untuk melanjutkan strategi tersirat.
Kecuali tentu saja, pemain bertindak menipu - membayar biaya kompleksitas yang sangat tinggi untuk mencontohkan diri mereka sendiri seperti biasanya bertindak dengan cara lain, untuk mempertahankan latar belakang yang berbeda sebelumnya, karena mereka mengharapkan keuntungan dengan mengkhianati mereka yang tertipu nanti.
Strategi optimal sangat optimal. Strategi optimal dengan pengembalian yang diharapkan lebih tinggi yang mengarah pada kehancuran tidak optimal. Kekokohan bergantung pada kesederhanaan, yang relatif terhadap teori pikiran tentang diri, orang lain, dan kolektif "kita".
Aturan tentang keputusan optimal di bawah ketidakpastian ini bukanlah saran, mereka adalah hukum dengan cara yang sama seperti pembaruan Bayesian. Apa yang Anda ketahui tentang diri Anda adalah kausal daripada strategi optimal Anda, dan ada biaya kompleksitas yang tidak dapat dihindari untuk penipuan yang mengikat model diri dengan kenyataan.
4,25K