Hugging Face Lança Open-R1 Para Criar Alternativa Open-Source ao Modelo R1 da DeepSeek

Por Diego Almeida
janeiro 29, 2025

Menos de uma semana após o lançamento do DeepSeek R1, um modelo de raciocínio que já rivaliza o OpenAI o1, a Hugging Face anunciou o Open-R1, um projeto ambicioso para replicar e abrir completamente a tecnologia da DeepSeek.

O Open-R1 tem um objetivo claro: reconstruir o R1 do zero e disponibilizar todos os componentes do modelo, incluindo dados de treinamento e código de ajuste fino, algo que a DeepSeek não tornou público.

Por Que Open-R1?

Apesar de a DeepSeek ter liberado o modelo R1 sob uma licença permissiva, a comunidade criticou a falta de transparência em relação aos dados de treinamento e à metodologia utilizada. Isso dificulta a pesquisa e a personalização do modelo.

De acordo com Elie Bakouch, engenheiro da Hugging Face e um dos líderes do projeto, o Open-R1 busca trazer clareza ao processo:

“Ter controle sobre o conjunto de dados e o processo de treinamento é essencial para implantar modelos de forma responsável em áreas sensíveis e para entender e mitigar vieses,” afirmou Bakouch ao TechCrunch.

O Poder dos Modelos de Raciocínio

Modelos como o DeepSeek R1 e o OpenAI o1 se destacam por sua capacidade de autoverificação, reduzindo erros comuns em IA. Embora esses modelos levem mais tempo para gerar respostas (de segundos a minutos), são mais confiáveis em áreas como física, matemática e ciências.

O sucesso do R1, impulsionado pela ascensão do app da DeepSeek ao topo da App Store, levou muitos analistas a questionarem se os EUA conseguirão manter sua liderança no setor de IA.

No entanto, os pesquisadores da Hugging Face afirmam que a iniciativa não é sobre geopolítica, mas sim sobre tornar o conhecimento acessível a todos.

O Plano Para Replicar o R1

A Hugging Face pretende reconstruir o modelo usando seu Science Cluster, um servidor de pesquisa equipado com 768 GPUs Nvidia H100. A abordagem será dividida em três etapas:

Gerar conjuntos de dados similares aos usados pela DeepSeek.
Criar um pipeline de treinamento aberto.
Convidar a comunidade para refinar e testar o modelo no GitHub.

Desde seu anúncio, o Open-R1 já acumulou 10.000 estrelas no GitHub em apenas três dias, demonstrando forte interesse da comunidade.

O Impacto do Open-R1

Caso o projeto tenha sucesso, pesquisadores poderão construir em cima do treinamento original, criando novos modelos open-source que desafiem a supremacia de laboratórios fechados como OpenAI e Anthropic.

Embora especialistas alertem sobre possíveis abusos da IA open-source, Bakouch argumenta que os benefícios superam os riscos:

“Quando a receita do R1 for replicada, qualquer pessoa com acesso a GPUs poderá criar sua própria versão e treinar com seus próprios dados, democratizando ainda mais a tecnologia.”

Conclusão

O Open-R1 representa um avanço importante na luta por transparência e acessibilidade na IA. Enquanto a DeepSeek abalou o mercado com um modelo eficiente e barato, a Hugging Face pretende garantir que essa inovação não fique presa a um “código fechado disfarçado de open-source”.

Se bem-sucedido, o Open-R1 não apenas nivela o campo de jogo na corrida por IA, mas também prova que o código aberto continua sendo uma força essencial no avanço da tecnologia.