🚨 BREAKING: Princeton membangun AI yang berubah dari hampir tidak berguna menjadi sangat dipersonalisasi hanya dalam 36 percakapan. Setiap kali Anda memberi tahu AI "itu salah" atau mengajukan pertanyaan yang sama dua kali karena melewatkan poin bahwa reaksi adalah umpan balik paling berharga yang pernah diterimanya. Setiap sistem AI yang dibangun saat ini mengabaikannya sepenuhnya. Princeton membangun sistem yang disebut OpenClaw RL yang memperbaiki ini. Idenya sederhana: ketika Anda mengoreksi AI, ia belajar dari koreksi itu di tempat. Tidak ada insinyur yang terlibat. Tidak ada pelatihan ulang. Hanya percakapan yang sudah Anda lakukan. Model memperhatikan bagaimana Anda merespons setelah setiap balasan: > permintaan ulang berarti gagal > balasan yang mulus berarti itu berhasil Seiring waktu, ia mencari tahu dengan tepat apa yang Anda inginkan dan menyesuaikan agar sesuai. Dalam pengujian mereka: > asisten AI berubah dari hampir tidak berguna menjadi sangat dipersonalisasi hanya dalam 36 percakapan > asisten penilaian belajar menulis umpan balik yang lebih hangat dan lebih rinci setelah hanya 24 interaksi Itu menjadi lebih baik hanya dengan digunakan. > skor personalisasi sebelum: 0,17 > setelah 36 percakapan: 0,81 > tidak ada pelatihan ulang, tidak ada insinyur, tidak ada waktu henti > bekerja saat AI masih berbicara dengan Anda Setiap "tidak, bukan itu yang saya maksud" yang pernah Anda ketik adalah pelajaran gratis. AI tidak pernah menyimpannya. Sampai sekarang.