Bolt42

Junte-se aos nossos boletins diários e semanais para atualizações mais recentes e conteúdo exclusivo sobre a cobertura de IA de liderança na indústria. Saiba mais


O Google lançou de forma discreta uma grande atualização em seu popular modelo de inteligência artificial, Gemini, que agora explica seu processo de raciocínio, estabelece novos recordes de desempenho em tarefas matemáticas e científicas, e oferece uma alternativa gratuita aos serviços pagos da OpenAI.

O novo modelo Gemini 2.0 Flash Thinking, lançado na terça-feira no Google AI Studio sob a designação experimental “Exp-01-21”, alcançou uma pontuação de 73,3% no Exame Americano de Matemática (AIME) e 74,2% no benchmark científico GPQA Diamond. Esses resultados mostram melhorias claras em relação aos modelos de IA anteriores e demonstram a crescente força do Google em raciocínio avançado.

“Temos pioneirado esses tipos de sistemas de planejamento por mais de uma década, começando com programas como o AlphaGo, e é empolgante ver a poderosa combinação dessas ideias com os modelos de base mais capazes,” escreveu Demis Hassabis, CEO da Google DeepMind, em uma postagem no X.com (antigo Twitter).

Gemini 2.0 Flash Thinking quebra recordes com processamento de um milhão de tokens

A característica mais marcante do modelo é sua capacidade de processar até um milhão de tokens de texto — cinco vezes mais do que o modelo o1 Pro da OpenAI — enquanto mantém tempos de resposta mais rápidos. Esta janela de contexto expandida permite que o modelo analise simultaneamente vários artigos de pesquisa ou conjuntos de dados extensos, uma capacidade que pode transformar a maneira como pesquisadores e analistas trabalham com grandes volumes de informação.

“Como um primeiro experimento, tomei vários textos religiosos e filosóficos e pedi ao Gemini 2.0 Flash Thinking que os entrelaçasse, extraindo insights novos e únicos,” disse Dan Mac, um pesquisador de IA que testou o modelo, em uma postagem no X.com. “Ele processou 970.000 tokens no total. A saída é incrível.”

O lançamento ocorre em um momento crítico na evolução da indústria de IA. A OpenAI anunciou recentemente seu modelo o3, que alcançou uma pontuação de 87,7% no benchmark GPQA Diamond. No entanto, a decisão do Google de oferecer seu modelo gratuitamente durante a fase beta (com limites de uso) pode atrair desenvolvedores e empresas que buscam alternativas ao assinatura mensal de $200 da OpenAI.

Resultados de benchmarking mostram que o mais recente modelo Gemini 2.0 Flash Thinking do Google supera dramaticamente as versões anteriores em tarefas de matemática, ciência e raciocínio. (Crédito: Google DeepMind)

Google oferece Gemini 2.0 Flash Thinking gratuito com execução de código integrada

Jeff Dean, Cientista Chefe da Google DeepMind, enfatizou as melhorias na confiabilidade do modelo: “Estamos continuando a iterar, com maior confiabilidade e redução de contradições entre os pensamentos e as respostas finais do modelo,” escreveu.

O modelo também inclui capacidades nativas de execução de código, permitindo que desenvolvedores executem e testem código diretamente dentro do sistema. Esse recurso, combinado com melhorias nas salvaguardas contra contradições, posiciona o Gemini 2.0 Flash Thinking como um sério concorrente para aplicações de pesquisa e comerciais.

Analistas da indústria observam que o foco do Google em explicar seu processo de raciocínio pode ajudar a resolver crescentes preocupações sobre transparência e confiabilidade da IA. Diferentemente dos modelos tradicionais de “caixa preta”, o Gemini 2.0 Flash Thinking mostra seu trabalho, facilitando que os usuários entendam e verifiquem suas conclusões.

A transparência da IA se torna o novo campo de batalha enquanto o Google desafia a OpenAI

O modelo já conquistou o primeiro lugar no ranking do Chatbot Arena, um importante benchmark para desempenho da IA, liderando em categorias como prompts difíceis, codificação e escrita criativa.

No entanto, permanecem questões sobre o desempenho e limitações do modelo no mundo real. Embora as pontuações de benchmark forneçam métricas valiosas, nem sempre se traduzem diretamente em aplicações práticas. O desafio do Google será convencer os clientes empresariais de que sua oferta gratuita pode igualar ou superar as capacidades das alternativas premium.

À medida que a corrida armamentista de IA se intensifica, o mais recente lançamento do Google sugere uma mudança de estratégia: combinar capacidades avançadas com acessibilidade. Se essa abordagem ajudará a diminuir a diferença com a OpenAI ainda precisa ser vista, mas certamente oferece aos tomadores de decisão técnica uma razão convincente para reconsiderar suas parcerias de IA.

Por enquanto, uma coisa é clara: a era da IA que pode mostrar seu trabalho chegou, e está disponível para qualquer pessoa com uma conta do Google.





    nove − 4 =




    Bolt42