Bolt42

Participe de nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre cobertura de IA líder no setor. Saiba mais


Um novo rei assumiu o trono dos modelos de codificação de IA: Hoje, a unidade de pesquisa em IA da Google, DeepMind, lançou a edição “I/O” do Gemini 2.5 Pro, uma nova versão do seu popular modelo de linguagem multimodal (LLM) Gemini 2.5 Pro, que foi lançado em março e que o CEO da DeepMind, Demis Hassabis, afirmou no X ser “o melhor modelo de codificação que já construímos!”

De fato, os primeiros benchmarks liberados pela empresa indicam que o Google tomou a dianteira — pela primeira vez desde que a corrida de IA generativa começou com o lançamento do ChatGPT no final de 2022 — superando todos os outros modelos em pelo menos um benchmark importante de codificação.

A nova versão, rotulada como “gemini-2.5-pro-preview-05-06”, substitui a versão anterior 03-25 e está agora disponível para desenvolvedores independentes no Google AI Studio e para empresas na plataforma em nuvem Vertex AI, além de usuários individuais no app Gemini. O comunicado do Google anunciou que ele também alimenta o Canvas do aplicativo Gemini e outros recursos.

A nova versão também impulsiona o desenvolvimento de recursos em aplicativos como Gemini 95, onde o modelo ajuda a combinar estilos visuais entre componentes automaticamente. Ela permite fluxos de trabalho, como converter vídeos do YouTube em aplicativos completos de aprendizado e criar componentes altamente estilizados — como players de vídeo responsivos ou interfaces de ditado animadas — com pouca ou nenhuma edição manual de CSS.

Trata-se de um modelo proprietário, o que significa que as empresas terão que pagar ao Google para utilizá-lo, e o acesso será apenas através dos serviços web do Google. No entanto, isso não altera os preços ou limites de taxa; os usuários atuais do Gemini 2.5 Pro serão automaticamente direcionados ao modelo atualizado que custa $1.25/$10 por milhão de tokens de entrada/saída (para contextos de 200.000 tokens) em comparação com os $3/$15 do Claude 3.7 Sonnet.

A empresa enquadra esse movimento — às vésperas da Google I/O anual (entrada/saída) que ocorrerá mais tarde este mês em Mountain View e online, de 20 a 21 de maio — como uma resposta ao forte feedback da comunidade sobre a utilidade prática do Gemini em geração de código e design de interface no mundo real.

Logan Kilpatrick, Gerente Sênior de Produtos para a API Gemini e Google AI Studio, confirmou em um post do blog de desenvolvedores que a atualização também aborda feedback fundamental dos desenvolvedores em relação à chamada de funções, com melhorias na redução de erros e confiabilidade de gatilhos.

Principais pontuações de avaliadores humanos na geração de aplicativos web

No WebDev Arena Leaderboard, uma métrica de terceiros que classifica modelos com base na preferência humana pela capacidade de gerar aplicativos web visualmente atraentes e funcionais, o Gemini 2.5 Pro Preview (05-06) ultrapassou agora o Claude 3.7 Sonnet na primeira posição.

A nova versão obteve 1499.95 no leaderboard, colocando-a bem à frente do Sonnet 3.7 com 1377.10. O modelo anterior Gemini 2.5 Pro (03-25) ficou em terceiro lugar, com uma pontuação de 1278.96, significando que a edição I/O representa um salto de 221 pontos.

Como observado pelo usuário avançado de IA “Lisan al Gaib” no X, nem mesmo o GPT-4o (“o3”) da OpenAI conseguiu deslocar o Sonnet 3.7, destacando a importância do avanço do Gemini.

O aumento de desempenho do Gemini reflete uma melhor confiabilidade, estética e usabilidade em suas saídas.

Já recebendo críticas entusiásticas

Vários desenvolvedores e líderes de plataforma destacaram a confiabilidade aprimorada do modelo e sua aplicação em cenários de produção.

Silas Alberti, da Cognition, observou que o Gemini 2.5 Pro foi o primeiro modelo a concluir com sucesso um complexo refatoramento de um sistema de roteamento de backend, demonstrando o tipo de tomada de decisão esperada de um desenvolvedor sênior.

Michael Truell, CEO da ferramenta de codificação AI Cursor, afirmou que os testes internos mostram uma diminuição acentuada nas falhas de chamada de ferramentas, um problema anteriormente notado. Ele espera que os usuários encontrem a versão mais recente significativamente mais eficaz em ambientes práticos. O Cursor já integrou o Gemini 2.5 Pro em seu próprio agente de código, refletindo como os desenvolvedores estão usando o modelo como um componente central em fluxos de trabalho de desenvolvedor mais inteligentes.

Michele Catasta, presidente da Replit, descreveu o Gemini 2.5 Pro como o melhor modelo de fronteira para equilibrar capacidade e latência. Seus comentários sugerem que a Replit está considerando a integração do modelo em suas próprias ferramentas, especialmente para tarefas onde alta responsividade e confiabilidade são cruciais.

Da mesma forma, o educador de IA e fundador do chatbot privado BlueShell, Paul Couvert, notou no X que “suas capacidades de geração de código e UI são impressionantes.”

E como Pietro Schirano, CEO da ferramenta de arte de IA EverArt, observou no X, a nova edição I/O do Gemini 2.5 Pro conseguiu gerar uma simulação interativa do meme “1 gorila vs. 100 homens” que tem circulado nas redes sociais recentemente a partir de apenas um prompt.

Demonstrações de outro jogo de quebra-cabeça estilo Tetris interativo, com efeitos sonoros funcionando, que foi criado em menos de um minuto, levou o usuário do X “RameshR” (@rezmeram) a comentar que “a indústria de jogos casuais está morta!!”.

Esses endossos dão peso às alegações da DeepMind sobre melhorias práticas e podem encorajar uma adoção mais ampla em plataformas de desenvolvedores.

Aplicativos e programas completos a partir de um único prompt de texto

Uma das características marcantes da atualização é sua capacidade de construir aplicativos web ou simulações interativas completos a partir de um único prompt.

Isso se alinha à visão da DeepMind de simplificar o processo de prototipagem e desenvolvimento.

Demonstrações dentro do aplicativo Gemini mostram como os usuários podem transformar padrões visuais ou prompts temáticos em código utilizável, reduzindo a barreira de entrada para desenvolvedores orientados ao design e equipes que experimentam novas ideias.

Embora a arquitetura e as alterações internas do Gemini 2.5 Pro não tenham sido detalhadas publicamente, a ênfase continua em possibilitar experiências de desenvolvimento mais rápidas e intuitivas.

Ao se apoiar em suas forças em geração de código e entradas multimodais, o Gemini 2.5 Pro é posicionado menos como uma novidade de pesquisa e mais como uma ferramenta prática para desafios de codificação do mundo real. O lançamento antecipado reflete uma clara intenção da Google DeepMind de atender à demanda dos desenvolvedores e manter o impulso antes de seus grandes anúncios na conferência.





    quatro × um =




    Bolt42