O Google está lançando um novo modelo de IA projetado para oferecer desempenho robusto com foco na eficiência.
O modelo, Gemini 2.5 Flash, será lançado em breve na Vertex AI, a plataforma de desenvolvimento de IA do Google. A empresa afirma que oferece computação “dinâmica e controlável”, permitindo que os desenvolvedores ajustem o tempo de processamento com base na complexidade das consultas.
“[Você pode ajustar] o equilíbrio entre velocidade, precisão e custo para suas necessidades específicas,” escreveu o Google em um post de blog enviado ao TechCrunch. “Essa flexibilidade é fundamental para otimizar o desempenho do Flash em aplicações de alto volume e sensíveis a custo.”
O Gemini 2.5 Flash chega enquanto o custo dos modelos de IA de ponta continua em crescimento. Modelos de desempenho com preços mais acessíveis, como o 2.5 Flash, apresentam uma alternativa atraente em relação a opções mais caras, embora à custa de um pouco de precisão.
O Gemini 2.5 Flash é um modelo de “raciocínio”, similar ao o3-mini da OpenAI e ao R1 da DeepSeek. Isso significa que leva um pouco mais de tempo para responder perguntas a fim de verificar suas próprias informações.
O Google afirma que o 2.5 Flash é ideal para aplicações “de alto volume” e “em tempo real”, como atendimento ao cliente e interpretação de documentos.
“Esse modelo robusto é otimizado especificamente para baixa latência e redução de custos,” disse o Google em seu post de blog. “É o motor ideal para assistentes virtuais responsivos e ferramentas de sumarização em tempo real, onde a eficiência em larga escala é fundamental.”
O Google não publicou um relatório de segurança ou técnico para o Gemini 2.5 Flash, tornando mais difícil identificar onde o modelo se destaca e onde apresenta falhas. A empresa revelou anteriormente ao TechCrunch que não divulga relatórios para modelos que considera “experimentais.”
O Google também anunciou, na quarta-feira, que planeja levar modelos Gemini como o 2.5 Flash para ambientes on-premises a partir do terceiro trimestre. Os modelos Gemini da empresa estarão disponíveis no Google Distributed Cloud (GDC), a solução on-premises do Google para clientes com requisitos rigorosos de governança de dados. O Google afirma que está trabalhando com a Nvidia para disponibilizar modelos Gemini em sistemas Nvidia Blackwell compatíveis com GDC, que os clientes poderão adquirir através do Google ou de seus canais preferidos.
Conteúdo relacionado
ChatGPT se refere a usuários pelo nome sem solicitação, e alguns acham isso ‘estranho’
[the_ad id="145565"] Alguns usuários do ChatGPT notaram um fenômeno estranho recentemente: O chatbot ocasionalmente se refere a eles pelo nome enquanto raciocina sobre…
De ‘acompanhar’ a ‘nos acompanhar’: Como o Google silenciosamente assumiu a liderança em IA empresarial.
[the_ad id="145565"] Participe de nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA de ponta. Saiba Mais Há…
Tudo o que você precisa saber sobre o chatbot de IA
[the_ad id="145565"] O ChatGPT, o chatbot de IA geradora de texto da OpenAI, conquistou o mundo desde seu lançamento em novembro de 2022. O que começou como uma ferramenta para…