Finns det någon lekplats eller motsvarande för att se verktygsanvändning / agentisk prestanda för olika modeller? Jag vill i huvudsak ge det 5 verktyg och min vanliga uppmaning Och lekplatsen genererar ~5-10 fall och kör alla valda modeller Och sedan observerar jag + byter modell, snabb
4,71K