12/12 vấn đề đã được giải quyết, điều này tương đương với một màn trình diễn đứng đầu. Các giải pháp của GPT-5 đã chịu trách nhiệm giải quyết 11/12 vấn đề trong số đó.