Estamos lançando o BrowseComp, que significa Competição de Navegação. 🏎️ Pense nisso como competições de programação ou matemática – embora esses concursos possam não refletir perfeitamente SWE do mundo real ou pesquisa matemática, eles capturam uma centelha de inteligência. Esta é a referência com a qual devemos nos preocupar ao avaliar a inteligência de agentes de navegação de pesquisa profunda.
OpenAI
OpenAI11/04/2025
We’re open-sourcing BrowseComp (“Browsing Competition”), a new, challenging benchmark designed to test how well AI agents can browse the internet to find hard-to-locate information. It’s like an online scavenger hunt…but for browsing agents.
465,43K