Słyszałem, że uczenie przez wzmocnienie działa tylko z weryfikowalnymi nagrodami? 😛 Gratulacje!!
Alexander Wei
Alexander Wei19 lip 2025
1/N Cieszę się, że mogę podzielić się tym, że nasz najnowszy @OpenAI eksperymentalne rozumowanie LLM osiągnął wieloletnie wielkie wyzwanie w dziedzinie sztucznej inteligencji: złoty medal na najbardziej prestiżowym konkursie matematycznym na świecie - Międzynarodowej Olimpiadzie Matematycznej (IMO).
31,74K