Jak więc wygląda gpt oss w kontekście dostrajania i RL?
8,7K