O Google está lançando um novo modelo de IA projetado para oferecer desempenho robusto com foco na eficiência.
O modelo, Gemini 2.5 Flash, será lançado em breve na Vertex AI, a plataforma de desenvolvimento de IA do Google. A empresa afirma que oferece computação “dinâmica e controlável”, permitindo que os desenvolvedores ajustem o tempo de processamento com base na complexidade das consultas.
“[Você pode ajustar] o equilíbrio entre velocidade, precisão e custo para suas necessidades específicas,” escreveu o Google em um post de blog enviado ao TechCrunch. “Essa flexibilidade é fundamental para otimizar o desempenho do Flash em aplicações de alto volume e sensíveis a custo.”
O Gemini 2.5 Flash chega enquanto o custo dos modelos de IA de ponta continua em crescimento. Modelos de desempenho com preços mais acessíveis, como o 2.5 Flash, apresentam uma alternativa atraente em relação a opções mais caras, embora à custa de um pouco de precisão.
O Gemini 2.5 Flash é um modelo de “raciocínio”, similar ao o3-mini da OpenAI e ao R1 da DeepSeek. Isso significa que leva um pouco mais de tempo para responder perguntas a fim de verificar suas próprias informações.
O Google afirma que o 2.5 Flash é ideal para aplicações “de alto volume” e “em tempo real”, como atendimento ao cliente e interpretação de documentos.
“Esse modelo robusto é otimizado especificamente para baixa latência e redução de custos,” disse o Google em seu post de blog. “É o motor ideal para assistentes virtuais responsivos e ferramentas de sumarização em tempo real, onde a eficiência em larga escala é fundamental.”
O Google não publicou um relatório de segurança ou técnico para o Gemini 2.5 Flash, tornando mais difícil identificar onde o modelo se destaca e onde apresenta falhas. A empresa revelou anteriormente ao TechCrunch que não divulga relatórios para modelos que considera “experimentais.”
O Google também anunciou, na quarta-feira, que planeja levar modelos Gemini como o 2.5 Flash para ambientes on-premises a partir do terceiro trimestre. Os modelos Gemini da empresa estarão disponíveis no Google Distributed Cloud (GDC), a solução on-premises do Google para clientes com requisitos rigorosos de governança de dados. O Google afirma que está trabalhando com a Nvidia para disponibilizar modelos Gemini em sistemas Nvidia Blackwell compatíveis com GDC, que os clientes poderão adquirir através do Google ou de seus canais preferidos.
Conteúdo relacionado
Sam Altman no TED 2025: Dentro da entrevista de IA mais desconfortável — e importante — do ano.
[the_ad id="145565"] Assine nossas newsletters diárias e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA líder na indústria. Saiba Mais…
O Google usou IA para suspender mais de 39 milhões de contas de anúncios suspeitas de fraude.
[the_ad id="145565"] O Google anunciou na quarta-feira que suspendeu 39,2 milhões de contas de anunciantes em sua plataforma em 2024 — mais de três vezes o número do ano…
Quando o raciocínio da IA dá errado: A pesquisa da Microsoft revela que mais tokens podem significar mais problemas
[the_ad id="145565"] Sure! Here’s the rewritten content in Portuguese while keeping the HTML tags intact: <div> <div id="boilerplate_2682874"…