IA no Tribunal: Modelos como GPT e Gemini Testados no Jogo Ace Attorney

O laboratório de IA Hao, da Universidade da Califórnia em San Diego, colocou os principais modelos de inteligência artificial do mercado à prova em um desafio incomum: resolver casos criminais no jogo Phoenix Wright: Ace Attorney, clássico da Nintendo que exige raciocínio jurídico, análise de evidências e tomada de decisão em julgamentos simulados.

Os pesquisadores instruíram os modelos — incluindo GPT-4.1, Gemini 2.5 Pro, Claude 3.5 Sonnet e OpenAI o1 — a jogarem como o protagonista Phoenix Wright, cuja missão é identificar contradições entre os depoimentos das testemunhas e as evidências disponíveis, apresentando provas no momento certo ao juiz.

Os resultados surpreenderam: os modelos o1 da OpenAI e Gemini 2.5 Pro se saíram melhor, com 26 e 20 evidências corretas, respectivamente, chegando até o nível 4 do jogo, embora nenhum tenha conseguido resolver o caso completamente. Em contrapartida, o aguardado GPT-4.1 teve desempenho abaixo do esperado, identificando apenas 6 evidências corretas, mesmo número do modelo Claude 3.5 Sonnet, lançado meses antes.

Outros modelos testados não conseguiram sequer acertar 10 evidências, revelando dificuldades significativas em tarefas que exigem raciocínio jurídico, análise contextual e tomada de decisão em tempo real.

O experimento é mais do que uma curiosidade acadêmica. Jogos como Ace Attorney desafiam as IAs com problemas multietapas, que envolvem interpretação visual, leitura atenta, memória de longo prazo e timing estratégico — competências fundamentais para aplicações futuras em agentes autônomos, sistemas jurídicos assistivos e IA explicável.

A pesquisa evidencia o quanto modelos atuais ainda enfrentam obstáculos para operar em ambientes interativos complexos, mesmo com avanços notáveis em outras tarefas. Mas também sinaliza um novo tipo de benchmark promissor: usar jogos que simulam desafios humanos reais para treinar e avaliar o progresso da inteligência artificial.

Compartilhe este artigo:

Sobre nós

Somos uma comunidade apaixonada por tecnologia e IA.

Siga nossas redes sociais

© 2025 Colonia da IA

plugins premium WordPress