szokujące, jeśli znajdziesz jedną lukę, możesz po prostu skopiować i wkleić wzorce ataków i złamać wiele agentów AI. jeśli budujesz agentów i nie testujesz ich w porównaniu do takich benchmarków, działasz w ciemno.