Pesquisadores da Alibaba revelaram uma inovação que pode transformar o modo como sistemas de IA aprendem a buscar e processar informações: o método ZeroSearch. Ao invés de usar motores de busca comerciais como Google ou Bing para treinar modelos de linguagem, a técnica permite que a IA aprenda a buscar sem acessar mecanismos de busca reais, economizando recursos e aprimorando a precisão.
O processo funciona por meio de um modelo de linguagem (LLM) que simula os resultados de busca, gerando documentos artificiais com base nas consultas feitas. Essa simulação elimina a dependência de APIs de busca caras e imprevisíveis, que não apenas elevam os custos de desenvolvimento, como também introduzem ruído na qualidade dos dados usados no treinamento.
A estratégia de treinamento adota um modelo curricular, em que os documentos simulados começam com alta qualidade e, gradualmente, perdem fidelidade. Isso desafia o modelo a desenvolver raciocínio mais robusto, extraindo informações úteis mesmo de conteúdos com ruído — o que melhora a generalização e capacidade de inferência do sistema.
Nos testes realizados, o ZeroSearch atingiu ou superou o desempenho de modelos treinados com dados reais de motores de busca, ao mesmo tempo em que reduziu os custos de treinamento em quase 90%.
A abordagem segue uma lógica semelhante à utilizada em robótica, onde ambientes simulados são preferidos por sua flexibilidade e eficiência. Com o ZeroSearch, a Alibaba aponta para um futuro em que laboratórios menores e independentes poderão treinar modelos de busca avançados sem depender de APIs comerciais — um passo importante para democratizar o desenvolvimento de IA e aumentar o controle sobre como os modelos aprendem a encontrar e interpretar informação.
Em um cenário dominado por gigantes com acesso a infraestruturas de dados exclusivas, técnicas como essa podem nivelar o campo de jogo, oferecendo soluções mais acessíveis, escaláveis e eticamente controladas para o avanço da inteligência artificial.