A corrida pela inteligência artificial mais acessível e eficiente ganhou um novo capítulo com um avanço surpreendente: pesquisadores das universidades Stanford e Washington conseguiram treinar um modelo de raciocínio artificial semelhante ao da OpenAI em apenas 26 minutos e por um custo inferior a $50.
O modelo, chamado s1, foi desenvolvido utilizando a técnica de destilação, que permite que modelos menores aprendam a partir de respostas fornecidas por sistemas mais robustos. Neste caso, os pesquisadores usaram respostas do Google Gemini 2.0 Flash Thinking Experimental para refinar o s1.
Como o Modelo Foi Criado?
Os pesquisadores começaram com um conjunto de 59.000 perguntas, mas descobriram que um subconjunto reduzido de apenas 1.000 perguntas era suficiente para treinar o modelo com bons resultados. O treinamento ocorreu em apenas 16 GPUs Nvidia H100, demonstrando que modelos avançados podem ser desenvolvidos com menos recursos do que os usados por gigantes da tecnologia.
O s1 foi baseado no Qwen2.5, um modelo de código aberto da Alibaba Cloud, e utilizou um método inovador chamado test-time scaling, no qual o modelo é incentivado a “pensar” por mais tempo antes de gerar uma resposta. Esse processo inclui comandos como “Wait” para forçar o modelo a revisar sua lógica e corrigir erros antes de finalizar uma resposta.
Impacto no Mercado de IA
A criação do s1 desafia diretamente empresas como OpenAI, Microsoft, Meta e Google, que gastam bilhões de dólares em data centers e GPUs de última geração para treinar modelos de IA cada vez maiores.
O próprio OpenAI o1, um modelo avançado de raciocínio, segue abordagem semelhante. Empresas como DeepSeek também tentaram replicar essa tecnologia, resultando em acusações da OpenAI de que estavam violando seus termos de serviço ao destilar informações de seus modelos para criar concorrentes.
Porém, segundo os pesquisadores, o s1 supera o o1-preview da OpenAI em até 27% em questões matemáticas de competição, sugerindo que modelos menores e mais acessíveis podem competir com as grandes potências da IA.
O Que Isso Significa para o Futuro da IA?
Se esse tipo de abordagem se tornar mais comum, pode revolucionar toda a indústria da inteligência artificial. Em vez de depender de modelos bilionários e gigantescos, empresas e pesquisadores poderiam criar modelos eficientes e competitivos com um custo extremamente reduzido.
Essa mudança poderia descentralizar o desenvolvimento de IA, permitindo que novas startups e instituições acadêmicas desafiem os líderes do setor. O impacto pode ser significativo não apenas na tecnologia, mas também na economia digital, na acessibilidade da IA e na forma como futuras inovações serão desenvolvidas.
A OpenAI e outras grandes empresas ainda não responderam a esse avanço, mas se a tendência de IA acessível continuar, podemos estar à beira de uma grande transformação na forma como a inteligência artificial é criada e utilizada.