🧪 Nieuwe Notebook Drop: LLM's evalueren op schadelijke outputs! Welke modellen zijn eigenlijk veilig voor prod? We hebben een LLM-as-a-Judge-pijplijn gebouwd met behulp van de Together Evals API om modellen te vergelijken op schadelijkheid. Code👇
1,74K