Nejlepší přednesení o minulosti/současnosti/budoucnosti kódovacích hodnocení na @aidotengineer CODE. V podstatě to sledujte podle Horizons: Sekundy: Copilot Arena minuty: LiveCodeBench více minut: RepoChat ~hodina: GSO více hodin: Syzygy Dny:??? když jsem @StringChaos pozval, aby mluvil, ani jsem nevěděl, že @Cursor_ai nastoupil na plný úvazek; Jen jsem doufal v příběh LiveCodeBench. Místo toho jsme dostali víc, než jsem kdy snil; Komplexní pohled na všechny způsoby, jakými se hodnocení kodování za poslední 3 roky vyvíjela, a vše, co se komunita naučila, včetně O3 hackování odměn a nyní benchmarků pro migraci OPRAVDU velkého množství kódu a online hodnocení pro přizpůsobení latence a reálným omezením. Končí to opravdu předpisovými doporučeními, pokud si také vytváříte vlastní kódovací hodnocení.