Bolt42

Participe de nossas newsletters diárias e semanais para as últimas atualizações e conteúdo exclusivo sobre cobertura de IA de ponta. Saiba Mais


Poucos meses após o lançamento do Gemini 2.0 e a ascensão do DeepSeek, o Google anunciou seu “modelo mais inteligente” até agora, o Gemini 2.5, capaz de raciocinar com melhor desempenho e precisão.

O Gemini 2.5 chega três meses após o Google ter lançado sua família de modelos anteriormente mais inteligentes, o Gemini 2.0, que introduziu casos de uso de raciocínio e agentes. Este novo modelo está disponível como Gemini 2.5 Pro (experimental) no Google AI Studio e para usuários do Gemini Advanced na interface de chat do Gemini. Em breve, também estará disponível no Vertex AI.

Koray Kavukcuoglu, CTO do Google DeepMind, afirmou em um post no blog que o Gemini 2.5 representa o próximo passo na meta do Google de tornar a “IA mais inteligente e capaz de raciocinar”.

“Agora, com o Gemini 2.5, alcançamos um novo nível de desempenho ao combinar um modelo base significativamente aprimorado com um treinamento pós-treinamento melhorado,” escreveu Kavukcuoglu. “A partir de agora, estamos incorporando essas capacidades de pensamento diretamente em todos os nossos modelos, para que possam lidar com problemas mais complexos e suportar agentes mais capazes e cientes do contexto.”

Mais contexto e compreensão

Assim como o Gemini 2.0 e o Gemini 2.0 Flash Thinking, o Gemini 2.5 Pro “pensa” antes de responder. O novo modelo pode lidar com entradas multimodais de texto, áudio, imagens, vídeos e grandes conjuntos de dados. O Gemini 2.5 Pro também pode entender repositórios de código inteiros para projetos de codificação.

O Gemini 2.5 Pro oferece algumas das maiores janelas de contexto disponíveis para modelos experimentais no Gemini. Ele vem com uma janela de contexto de 1 milhão de tokens, mas em breve será ampliado para 2 milhões de tokens. O gerente de produto do Google AI Studio, Logan Kilpatrick, postou no X que o Gemini 2.5 Pro é “o primeiro modelo experimental com limites de taxa mais altos + cobrança.”

O Google planeja anunciar preços para os modelos Gemini 2.5 em breve.

Desempenho aprimorado em codificação e raciocínio

O Google afirmou que o modelo lidera em testes de benchmark de raciocínio avançado. A empresa disse que o Gemini 2.5 Pro “lidera em benchmarks de correspondência e ciências como GPQA e AIME 2025.” Kavukcuoglu informou que o modelo também obteve “18,8% de pontuação de última geração, sem uso de ferramentas na Humanity’s Last Exam,” um conjunto de dados que visa capturar o conhecimento e raciocínio humano.

O Gemini 2.5 Pro também se destaca em tarefas de codificação e obteve pontuações superiores ao Gemini 2.0 em benchmarks específicos. O Google observou que o novo modelo “se destaca na criação de aplicativos web visualmente atraentes e aplicações de código agentic, além de transformação e edição de código.”

Um mercado mais competitivo

O Gemini 2.5 Pro entra na disputa por modelos de raciocínio em um ambiente significativamente diferente do que o Gemini 2.0 enfrentou em dezembro. O lançamento do modelo de linguagem de grande porte (LLM) DeepSeek-R1, da DeepSeek, mostrou que modelos poderosos podem ter um desempenho excelente a uma fração do custo de treinamento e computação. Além disso, a DeepSeek demonstrou que modelos de código aberto podem competir com LLMs mais fechados, como os modelos o1 e o3 da OpenAI.

Além das crescentes ofertas de modelos da DeepSeek, o Google também precisa competir com os modelos de raciocínio da OpenAI. Embora o modelo mais recente da OpenAI tenha sido o GPT-4.5 —não um modelo de raciocínio— a empresa ainda deve desenvolver mais modelos de raciocínio em breve.

O Gemini 2.5 é o segundo novo modelo do Google neste mês. Em março, a empresa lançou a versão mais recente de seu pequeno modelo de linguagem, Gemma 3, que ofereceu um modelo de contexto de 128.000 tokens e foi melhor para uso em dispositivos móveis.





    um × dois =




    Bolt42