Cel mai bun discurs despre trecutul/prezentul/viitorul evaluărilor de codare la @aidotengineer CODE. Practic, urmărește-l după orizonturi: Al doilea: Copilot Arena Proces-verbal: LiveCodeBench mai multe minute: RepoChat ~oră: GSO mai multe ore: Syzygy Zile:??? când l-am invitat pe @StringChaos să vorbească, nici măcar nu știam că se înrolase @Cursor_ai cu normă întreagă; Speram doar la povestea LiveCodeBench. În schimb, am primit mai mult decât am visat vreodată; o privire cuprinzătoare asupra tuturor modurilor în care evaluările de koding au evoluat în ultimii 3 ani și tot ce a învățat comunitatea, inclusiv hacking-ul de recompense din O3, și acum benchmark-uri pentru migrarea unor cantități FOARTE mari de cod și evaluări online pentru a ajusta latența și constrângerile din lumea reală. Se încheie cu câteva recomandări chiar prescriptive dacă construiești și evaluări de codare proprii.