A corrida pela liderança em inteligência artificial ganhou mais um capítulo com o lançamento do Grok Vision, recurso da xAI que permite ao chatbot Grok identificar e responder perguntas sobre elementos visuais capturados pela câmera do smartphone. A novidade, que estreou na versão iOS do aplicativo, coloca o Grok em pé de igualdade com rivais como o Gemini do Google e o ChatGPT da OpenAI, ambos já equipados com funcionalidades de visão em tempo real.
Com o Grok Vision, usuários podem simplesmente apontar a câmera do celular para produtos, placas, documentos e outros objetos para obter informações contextuais instantâneas. A funcionalidade representa um avanço significativo na integração entre IA conversacional e visão computacional, tornando o Grok mais interativo e útil em situações cotidianas.
Introducing Grok Vision, multilingual audio, and realtime search in Voice Mode. Available now.
— Ebby Amir (@ebbyamir) April 22, 2025
Grok habla español
Grok parle français
Grok Türkçe konuşuyor
グロクは日本語を話す
ग्रोक हिंदी बोलता है pic.twitter.com/lcaSyty2n5
Além da visão por câmera, a xAI também liberou novos recursos para o chatbot, como áudio multilíngue e busca em tempo real no modo de voz. Essas funcionalidades já estão disponíveis para usuários do Android — mas somente para assinantes do plano SuperGrok, que custa US$ 30 por mês.
Nos últimos meses, o Grok tem evoluído rapidamente. A xAI recentemente adicionou memória contextual, permitindo que o chatbot lembre de informações de conversas anteriores, e lançou uma ferramenta tipo “canvas” para criação de documentos e aplicativos — reforçando a proposta de um assistente digital multifuncional.
Com essas melhorias, o Grok se consolida como um dos projetos de IA mais dinâmicos do mercado, refletindo a ambição da xAI de liderar uma nova geração de assistentes inteligentes — mais visuais, mais personalizados e mais integrados ao cotidiano.