Google lança Gemini 2.5 Flash com “orçamento de pensamento” para IA mais estratégica

Por Diego Almeida
abril 21, 2025

A Google acaba de lançar o Gemini 2.5 Flash, um modelo de IA híbrido que combina desempenho de ponta com controle orçamentário inteligente. Mesmo sendo mais leve e econômico, o novo modelo supera o Claude 3.5 Sonnet em tarefas de raciocínio lógico, STEM e visual — e introduz uma inovação estratégica: o “thinking budget”, ou orçamento de pensamento.

Esse novo recurso permite aos desenvolvedores definir quantos tokens a IA pode gastar pensando, de forma proporcional à complexidade da tarefa. Para perguntas simples, a IA responde rapidamente com baixo custo. Já em tarefas críticas, pode-se autorizar até 24 mil tokens de raciocínio, garantindo respostas mais completas — mas somente quando necessário.

O Gemini 2.5 Flash também traz melhorias robustas sobre seu antecessor (2.0 Flash), tanto em velocidade quanto em qualidade, e mantém custo significativamente inferior ao de modelos concorrentes. Está disponível via API no Google AI Studio e Vertex AI, além de estar sendo testado dentro do app Gemini como opção experimental.

O modelo representa um avanço importante para empresas que buscam eficiência em escala sem comprometer desempenho. Combinando razão sob demanda e custos otimizados, o Gemini 2.5 Flash se posiciona como uma solução estratégica para fluxos que exigem grande volume de processamento, mas reserva poder de raciocínio para os momentos certos.

Enquanto OpenAI continua atraindo os holofotes, o Google mostra que está jogando no mesmo ritmo e com propostas técnicas inovadoras — e, ao que tudo indica, mais adaptáveis aos desafios do uso corporativo em larga escala.