om det är avgörande att bygga fler RL-miljöer för LLM:er för att främja AI-framsteg och förbättra kapaciteten inom områden med höga insatser, måste vi kraftigt öka tillgängligheten för att lära oss hur man gör det bra. handledningar finns inte. Det finns ingen lärobok. Låt oss ändra på det.
35,72K