ARC Prize Retorna com Novo Desafio de Raciocínio para IA e Prêmio de US$ 1 Milhão

Por Diego Almeida
março 25, 2025

A ARC Prize Foundation acaba de lançar o ARC-AGI-2, uma nova versão de seu benchmark de raciocínio para inteligência artificial, acompanhado de uma competição global com US$ 1 milhão em prêmios. O objetivo é testar até que ponto os modelos de IA conseguem resolver tarefas simples para humanos, mas ainda desafiadoras para as máquinas — aproximando o setor da tão discutida AGI (Inteligência Artificial Geral).

O Que É o ARC-AGI-2?

O novo benchmark foi projetado para medir habilidades de raciocínio fundamentais, com base em tarefas que:

São facilmente resolvidas por humanos (dois indivíduos conseguem solucionar em até duas tentativas);
Exigem compreensão, inferência e abstração, em vez de simples reconhecimento de padrões.

Na nova versão, até os melhores modelos atuais de IA têm desempenho fraco. Por exemplo, o OpenAI o3-low atinge apenas 4% de acurácia estimada, enquanto no benchmark anterior (AGI-1), o mesmo modelo alcançava mais de 75%.

Novo Foco em Eficiência Computacional

Além da acurácia, o ARC-AGI-2 introduz uma métrica de eficiência, avaliando o custo computacional por tarefa resolvida. Isso visa encorajar o desenvolvimento de modelos que sejam não apenas inteligentes, mas também econômicos e sustentáveis em termos de recursos — um ponto crítico para o futuro da IA escalável.

A Competição ARC Prize 2025

A competição foi oficialmente lançada esta semana e está aberta a equipes de todo o mundo. O prêmio total de US$ 1 milhão será dividido da seguinte forma:

US$ 700 mil para a primeira equipe a alcançar 85% de acurácia dentro dos limites de eficiência;
O restante será distribuído entre outros marcos e contribuições técnicas.

O ARC Prize já havia ganhado destaque anteriormente com seu benchmark AGI-1, que provocou intenso debate sobre o progresso real da inteligência artificial. A nova versão promete ser um teste ainda mais rigoroso — embora especialistas acreditem que os “alvos móveis” da AGI continuarão se redefinindo à medida que os modelos evoluem.

Por Que Isso Importa?

Embora muitas empresas declarem que a AGI está próxima, benchmarks como o ARC-AGI-2 revelam que ainda existem lacunas fundamentais no raciocínio e eficiência dos modelos atuais. Essa iniciativa não só fornece uma métrica mais robusta para avaliar o progresso, como também incentiva a comunidade a desenvolver modelos mais alinhados à inteligência humana real — e mais acessíveis em termos computacionais.

A corrida pela AGI ganhou mais uma linha de chegada, e os próximos meses dirão se algum laboratório conseguirá cruzá-la.