Junte-se aos nossos boletins diários e semanais para atualizações mais recentes e conteúdo exclusivo sobre a cobertura de IA de liderança na indústria. Saiba mais
O Google lançou de forma discreta uma grande atualização em seu popular modelo de inteligência artificial, Gemini, que agora explica seu processo de raciocínio, estabelece novos recordes de desempenho em tarefas matemáticas e científicas, e oferece uma alternativa gratuita aos serviços pagos da OpenAI.
O novo modelo Gemini 2.0 Flash Thinking, lançado na terça-feira no Google AI Studio sob a designação experimental “Exp-01-21”, alcançou uma pontuação de 73,3% no Exame Americano de Matemática (AIME) e 74,2% no benchmark científico GPQA Diamond. Esses resultados mostram melhorias claras em relação aos modelos de IA anteriores e demonstram a crescente força do Google em raciocínio avançado.
“Temos pioneirado esses tipos de sistemas de planejamento por mais de uma década, começando com programas como o AlphaGo, e é empolgante ver a poderosa combinação dessas ideias com os modelos de base mais capazes,” escreveu Demis Hassabis, CEO da Google DeepMind, em uma postagem no X.com (antigo Twitter).
Nossa última atualização para nosso modelo Gemini 2.0 Flash Thinking (disponível aqui: https://t.co/Rr9DvqbUdO) teve uma pontuação de 73,3% no AIME (matemática) e 74,2% nos benchmarks do GPQA Diamond (ciência). Agradecemos todo o seu feedback, isso representa um progresso super rápido desde nosso primeiro lançamento apenas recentemente… pic.twitter.com/cM1gNwBoTO
— Demis Hassabis (@demishassabis) 21 de janeiro de 2025
Gemini 2.0 Flash Thinking quebra recordes com processamento de um milhão de tokens
A característica mais marcante do modelo é sua capacidade de processar até um milhão de tokens de texto — cinco vezes mais do que o modelo o1 Pro da OpenAI — enquanto mantém tempos de resposta mais rápidos. Esta janela de contexto expandida permite que o modelo analise simultaneamente vários artigos de pesquisa ou conjuntos de dados extensos, uma capacidade que pode transformar a maneira como pesquisadores e analistas trabalham com grandes volumes de informação.
“Como um primeiro experimento, tomei vários textos religiosos e filosóficos e pedi ao Gemini 2.0 Flash Thinking que os entrelaçasse, extraindo insights novos e únicos,” disse Dan Mac, um pesquisador de IA que testou o modelo, em uma postagem no X.com. “Ele processou 970.000 tokens no total. A saída é incrível.”
O lançamento ocorre em um momento crítico na evolução da indústria de IA. A OpenAI anunciou recentemente seu modelo o3, que alcançou uma pontuação de 87,7% no benchmark GPQA Diamond. No entanto, a decisão do Google de oferecer seu modelo gratuitamente durante a fase beta (com limites de uso) pode atrair desenvolvedores e empresas que buscam alternativas ao assinatura mensal de $200 da OpenAI.
Google oferece Gemini 2.0 Flash Thinking gratuito com execução de código integrada
Jeff Dean, Cientista Chefe da Google DeepMind, enfatizou as melhorias na confiabilidade do modelo: “Estamos continuando a iterar, com maior confiabilidade e redução de contradições entre os pensamentos e as respostas finais do modelo,” escreveu.
O modelo também inclui capacidades nativas de execução de código, permitindo que desenvolvedores executem e testem código diretamente dentro do sistema. Esse recurso, combinado com melhorias nas salvaguardas contra contradições, posiciona o Gemini 2.0 Flash Thinking como um sério concorrente para aplicações de pesquisa e comerciais.
Analistas da indústria observam que o foco do Google em explicar seu processo de raciocínio pode ajudar a resolver crescentes preocupações sobre transparência e confiabilidade da IA. Diferentemente dos modelos tradicionais de “caixa preta”, o Gemini 2.0 Flash Thinking mostra seu trabalho, facilitando que os usuários entendam e verifiquem suas conclusões.
Estamos continuando a iterar, com maior confiabilidade e redução de contradições entre os pensamentos e as respostas finais do modelo.
Confira como gemini-2.0-flash-thinking-exp-01-21 em https://t.co/sw0jY6k74m
— Jeff Dean (@JeffDean) 21 de janeiro de 2025
A transparência da IA se torna o novo campo de batalha enquanto o Google desafia a OpenAI
O modelo já conquistou o primeiro lugar no ranking do Chatbot Arena, um importante benchmark para desempenho da IA, liderando em categorias como prompts difíceis, codificação e escrita criativa.
No entanto, permanecem questões sobre o desempenho e limitações do modelo no mundo real. Embora as pontuações de benchmark forneçam métricas valiosas, nem sempre se traduzem diretamente em aplicações práticas. O desafio do Google será convencer os clientes empresariais de que sua oferta gratuita pode igualar ou superar as capacidades das alternativas premium.
À medida que a corrida armamentista de IA se intensifica, o mais recente lançamento do Google sugere uma mudança de estratégia: combinar capacidades avançadas com acessibilidade. Se essa abordagem ajudará a diminuir a diferença com a OpenAI ainda precisa ser vista, mas certamente oferece aos tomadores de decisão técnica uma razão convincente para reconsiderar suas parcerias de IA.
Por enquanto, uma coisa é clara: a era da IA que pode mostrar seu trabalho chegou, e está disponível para qualquer pessoa com uma conta do Google.
Insights diários sobre casos de uso de negócios com o VB Daily
Se você quer impressionar seu chefe, o VB Daily tem o que você precisa. Nós trazemos informações sobre o que as empresas estão fazendo com a IA generativa, desde mudanças regulatórias até implementações práticas, para que você possa compartilhar insights para um retorno máximo sobre o investimento.
Leia nossa Política de Privacidade
Obrigado por se inscrever. Confira mais boletins do VB aqui.
Ocorreu um erro.
Conteúdo relacionado
O impacto de US$ 100 bilhões da IA: a onda de capital de risco de 2024 e o futuro das startups
[the_ad id="145565"] Não é segredo que 2024 foi um ano marcante para a inteligência artificial, com o setor atraindo mais de $100 bilhões em financiamento — quase um terço do…
Elon Musk e Sam Altman se manifestam nas redes sociais sobre o Stargate
[the_ad id="145565"] O bilionário Elon Musk e o CEO da OpenAI, Sam Altman, estão em conflito no X sobre o Stargate, o enorme projeto de infraestrutura para construir data…