O Alibaba acaba de lançar o Wan2.1, um conjunto avançado de modelos de IA para geração de vídeos, desenvolvido pelo Tongyi Lab. A novidade representa um salto na qualidade dos modelos open-source, desafiando tecnologias fechadas como Sora, da OpenAI.
O Wan2.1-T2V-14B lidera o VBench leaderboard, destacando-se em:
- Dinâmica de movimentos complexos e simulação realista de física.
- Renderização de texto dentro de vídeos, em inglês e chinês.
- Geração multimodal, suportando text-to-video, image-to-video e video-to-audio.
Recursos e Ferramentas de Edição
O Wan2.1 também inclui ferramentas avançadas para edição de vídeo, como:
- Inpainting e outpainting, permitindo recriação e expansão de cenas.
- Referência a múltiplas imagens, mantendo consistência visual.
- Preservação de personagens e estruturas, garantindo identidade visual em vídeos gerados.
Desempenho e Eficiência Computacional
Para tornar a tecnologia mais acessível, a Alibaba disponibilizou uma versão leve do modelo:
- Wan2.1-1.3B, que pode rodar em hardwares convencionais.
- Capaz de gerar vídeos de 5 segundos em 480p em apenas 4 minutos em uma RTX 4090.
Por que Isso Importa?
O lançamento do Wan2.1 confirma o avanço das soluções open-source da China, competindo diretamente com gigantes como OpenAI e Google.
Seus recursos avançados e alta velocidade de geração podem revolucionar áreas como produção audiovisual, publicidade e criação de conteúdo, permitindo que desenvolvedores e empresas adotem soluções de IA mais acessíveis e personalizáveis.