Gemini 2.5 Flash: IA Eficiente do Google em Breve

O Google está lançando um novo modelo de IA projetado para oferecer desempenho robusto com foco na eficiência.

O modelo, Gemini 2.5 Flash, será lançado em breve na Vertex AI, a plataforma de desenvolvimento de IA do Google. A empresa afirma que oferece computação “dinâmica e controlável”, permitindo que os desenvolvedores ajustem o tempo de processamento com base na complexidade das consultas.

“[Você pode ajustar] o equilíbrio entre velocidade, precisão e custo para suas necessidades específicas,” escreveu o Google em um post de blog enviado ao TechCrunch. “Essa flexibilidade é fundamental para otimizar o desempenho do Flash em aplicações de alto volume e sensíveis a custo.”

O Gemini 2.5 Flash chega enquanto o custo dos modelos de IA de ponta continua em crescimento. Modelos de desempenho com preços mais acessíveis, como o 2.5 Flash, apresentam uma alternativa atraente em relação a opções mais caras, embora à custa de um pouco de precisão.

O Gemini 2.5 Flash é um modelo de “raciocínio”, similar ao o3-mini da OpenAI e ao R1 da DeepSeek. Isso significa que leva um pouco mais de tempo para responder perguntas a fim de verificar suas próprias informações.

O Google afirma que o 2.5 Flash é ideal para aplicações “de alto volume” e “em tempo real”, como atendimento ao cliente e interpretação de documentos.

“Esse modelo robusto é otimizado especificamente para baixa latência e redução de custos,” disse o Google em seu post de blog. “É o motor ideal para assistentes virtuais responsivos e ferramentas de sumarização em tempo real, onde a eficiência em larga escala é fundamental.”

O Google não publicou um relatório de segurança ou técnico para o Gemini 2.5 Flash, tornando mais difícil identificar onde o modelo se destaca e onde apresenta falhas. A empresa revelou anteriormente ao TechCrunch que não divulga relatórios para modelos que considera “experimentais.”

O Google também anunciou, na quarta-feira, que planeja levar modelos Gemini como o 2.5 Flash para ambientes on-premises a partir do terceiro trimestre. Os modelos Gemini da empresa estarão disponíveis no Google Distributed Cloud (GDC), a solução on-premises do Google para clientes com requisitos rigorosos de governança de dados. O Google afirma que está trabalhando com a Nvidia para disponibilizar modelos Gemini em sistemas Nvidia Blackwell compatíveis com GDC, que os clientes poderão adquirir através do Google ou de seus canais preferidos.