A ElevenLabs, empresa referência em inteligência artificial aplicada à voz, acaba de lançar o Scribe, seu mais novo modelo de transcrição de áudio. A promessa? Ser o mais preciso do mundo, superando gigantes da indústria como Google Gemini 2.0 Flash e OpenAI Whisper v3.
Alta Precisão e Suporte Global
O Scribe impressiona pelo suporte a 99 idiomas, oferecendo uma precisão superior a 95% em mais de 25 deles, incluindo inglês, italiano e espanhol. Além disso, o modelo atende a idiomas que tradicionalmente carecem de boas soluções de reconhecimento de fala, como sérvio, cantonês e malaiala.
Recursos Avançados
Entre os diferenciais do Scribe, estão:
- Identificação de múltiplos falantes, permitindo a separação das vozes em conversas com mais de uma pessoa.
- Timestamps palavra por palavra, garantindo uma transcrição mais estruturada e precisa.
- Reconhecimento de sons não verbais, como risadas e música, aumentando a riqueza do conteúdo transcrito.
Preço Acessível e Aplicações Futuras
O Scribe tem um custo competitivo de US$ 0,40 por hora de áudio transcrito para conteúdos pré-gravados. Em breve, a ElevenLabs também lançará uma versão de baixa latência, voltada para aplicações em tempo real.
Impacto no Mercado
Com sua alta precisão e adaptabilidade ao áudio do mundo real, o Scribe pode revolucionar a criação de legendas, a organização de arquivos de podcasts e a acessibilidade digital. Além disso, seu foco em idiomas menos assistidos por outras IAs expande o acesso a transcrição de qualidade para comunidades globais antes negligenciadas.
O Scribe já está disponível para quem busca transcrição rápida, precisa e inovadora, consolidando a ElevenLabs como um dos grandes nomes da IA aplicada à voz.