A Meta AI, por meio de sua divisão de pesquisa FAIR (Fundamental AI Research), acaba de publicar cinco novos projetos de inteligência artificial com foco em percepção, compreensão tridimensional e raciocínio colaborativo. As iniciativas têm como objetivo aprimorar a forma como sistemas de IA compreendem e interagem com o mundo físico — e todos os projetos foram disponibilizados em código aberto.
Entre os destaques está o Perception Encoder, um modelo que atingiu desempenho de ponta em tarefas visuais complexas, como identificar animais camuflados e rastrear movimentos sutis. A precisão alcançada coloca o encoder entre os mais avançados em interpretação visual de cenas naturais.
Outro avanço importante é o lançamento do Meta Perception Language Model (PLM), voltado à compreensão de vídeos. Junto a ele, a FAIR disponibilizou o PLM-VideoBench, um benchmark voltado à avaliação de modelos em tarefas que exigem raciocínio sobre elementos visuais em movimento — uma peça-chave para agentes multimodais.
No campo da percepção espacial, o projeto Locate 3D introduz um modelo que permite à IA entender objetos com base em instruções espaciais. Para isso, a Meta também liberou um vasto dataset com 130 mil anotações de linguagem espacial, oferecendo uma base robusta para treinar modelos com compreensão refinada de posições e relações 3D.
Por fim, a FAIR apresentou o Collaborative Reasoner, uma estrutura voltada para testar como múltiplos agentes de IA podem trabalhar juntos de forma eficaz. Em testes, os sistemas colaborativos obtiveram quase 30% de melhoria de desempenho em relação a modelos que atuam de forma isolada, apontando para uma nova fronteira em IA interativa.
Esses projetos mostram que a Meta está pavimentando o caminho para agentes autônomos mais conscientes, inteligentes e interativos — capazes de interpretar vídeos, compreender linguagem espacial, colaborar entre si e atuar em ambientes reais com sofisticação crescente. Em um cenário onde IA deixa de ser apenas uma interface textual e se transforma em uma entidade perceptiva, esses avanços marcam um passo significativo em direção à inteligência artificial incorporada e de propósito geral.