@aidotengineer CODE'da kodlama değerlendirmelerinin geçmiş/şimdi/geleceği hakkında en iyi konuşma. Temelde ufuklara göre takip et: saniyeler: Copilot Arena dakikalar: LiveCodeBench çoklu dakika: RepoChat ~saat: GSO çoklu saatler: Syzygy Gün:??? @StringChaos konuşmaya davet ettiğimde, tam zamanlı @Cursor_ai katıldığını bile bilmiyordum; Sadece LiveCodeBench'in hikayesini umuyordum. Bunun yerine hayal ettiğimden daha fazlasını elde ettik; Son 3 yılda koding değerlendirmelerinin nasıl geliştiğine ve topluluğun öğrendiği her şeye, O3'ün ödül hacklemesi ve şimdi de gecikme ve gerçek dünya kısıtlamalarına göre GERÇEKTEN büyük miktarda kod ve çevrimiçi değerlendirmelerin taşınması gibi ölçütlerin kapsamlı bir bakışı. Kendi kodlama değerlendirmelerinizi de oluşturuyorsanız gerçekten belirleyici önerilerle sona erer.