Bolt42

Participe de nossas newsletters diárias e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA líder no setor. Saiba mais


O último relatório de uso da Poe mostra que OpenAI e Google estão fortalecendo suas posições em categorias-chave de IA, enquanto Anthropic está perdendo espaço e capacidades de raciocínio especializadas estão emergindo como um campo de batalha competitivo crucial.

De acordo com dados divulgados hoje pela Poe, uma plataforma que oferece acesso a mais de 100 modelos de IA, ocorreram mudanças significativas na participação de mercado em todas as principais categorias de IA entre janeiro e maio de 2025. Os dados, coletados de assinantes da Poe, fornecem uma visão rara sobre as preferências reais dos usuários além dos benchmarks da indústria.

“Como um gateway universal para mais de 100 modelos de IA, a Poe tem uma visão única das tendências de uso em todo o ecossistema,” disse Nick Huber, Líder do Ecossistema de IA da Poe, em uma entrevista exclusiva ao VentureBeat. “As coisas mais surpreendentes que estão acontecendo agora são a rápida inovação (3x o número de lançamentos de janeiro a maio de 2025 em comparação com o mesmo período de 2024), um cenário competitivo cada vez mais diversificado, e os modelos de raciocínio são a clara história de sucesso do início de 2025.”

Um gráfico da Poe mostrando as classificações dos modelos de IA em diferentes categorias em maio de 2025. O GPT-4o da OpenAI domina na geração de texto com 35,8% de participação de uso, enquanto o Gemini-2.5-Pro do Google lidera nas capacidades de raciocínio e o Imagen3 na geração de imagens. (Créditos: Poe)

O GPT-4o mantém a dominância enquanto novos modelos rapidamente capturam participação de mercado

No núcleo da geração de texto, o GPT-4o da OpenAI manteve sua posição de comando com 35,8% da participação de mensagens, enquanto a nova família GPT-4.1 capturou rapidamente 9,4% de uso nas semanas seguintes ao seu lançamento. O Gemini 2.5 Pro do Google também alcançou aproximadamente 5% da participação de mensagens logo após sua introdução.

Esses ganhos vieram em grande parte à custa dos modelos Claude da Anthropic, que viu uma queda absoluta de 10% em sua participação durante o período de relatório. O relatório observa que o Claude 3.7 Sonnet agora substituiu substancialmente o anterior Claude 3.5 Sonnet na preferência dos usuários, embora este último ainda mantenha uma participação notável de 12%.

DeepSeek, que experimentou um crescimento viral no início deste ano, viu seu ímpeto desacelerar à medida que concorrentes lançaram seus próprios modelos de raciocínio acessíveis e verbosos. A participação de mensagens do DeepSeek R1 caiu de um pico de 7% em meados de fevereiro para 3% no final de abril.

As capacidades de resolução de problemas complexos se tornam um diferencial chave no mercado de IA

Talvez a tendência mais significativa identificada no relatório seja o crescimento dramático de modelos de raciocínio especializados, que aumentaram de aproximadamente 2% para 10% de todas as mensagens de texto enviadas na Poe desde o início de 2025.

“Os modelos de raciocínio, mesmo nos primeiros dias, demonstraram uma capacidade notável de lidar com tarefas complexas com maior precisão,” disse Huber ao VentureBeat. “Os primeiros adotantes certamente estão encontrando valor nisso e estão dispostos a assumir as compensações em custo e tempo de processamento por melhores resultados.”

Neste segmento de alto crescimento, o Gemini 2.5 Pro rapidamente se estabeleceu como um líder, capturando aproximadamente 31% do uso de modelos de raciocínio em apenas seis semanas após o lançamento. Agora lidera a categoria, à frente dos modelos de raciocínio especializados da Claude.

A OpenAI continua a inovar rapidamente neste espaço, lançando vários modelos de raciocínio (o1-pro, o3-mini, o3-mini-high, o3, e o4-mini) nos primeiros quatro meses de 2025. O relatório indica que os usuários da Poe rapidamente adotam as novas ofertas da OpenAI, fazendo a transição de modelos mais antigos como o o1 para alternativas mais novas como o o3.

O relatório também observou a emergência de modelos de raciocínio híbridos, como o Gemini 2.5 Flash Preview e Qwen 3, que podem ajustar dinamicamente seu nível de raciocínio dentro das conversas. No entanto, esses modelos atualmente representam apenas cerca de 1% do uso de modelos de raciocínio.

Analistas da indústria sugerem que essa mudança em direção a capacidades de raciocínio especializadas sinaliza um amadurecimento do mercado de IA, onde a geração bruta de texto está se tornando comoditizada, forçando os fornecedores a se diferenciarem por meio de capacidades de maior valor que podem comandar preços premium.

O Imagen 3 do Google desafia os players estabelecidos na arena de IA visual

O mercado de geração de imagens parece cada vez mais competitivo, com a família Imagen 3 do Google crescendo de aproximadamente 10% para 30% de participação durante 2025, agora rivalizando com a família FLUX de modelos da Black Forest Labs, que coletivamente mantinham cerca de 35% de participação em abril.

O GPT-Image-1 da OpenAI, introduzido na API no final de abril, rapidamente alcançou 17% da participação em geração de imagens em apenas duas semanas, espelhando sua adoção viral no aplicativo ChatGPT durante março e início de abril.

O relatório indica que os modelos FLUX mantiveram sua participação plural na geração de imagens na Poe, mas experimentaram uma leve queda de aproximadamente 45% para 35% durante o período de relatório.

Essa competição a três entre Google, OpenAI e Black Forest Labs marca uma mudança significativa desde o início de 2024, quando variantes da Midjourney e Stable Diffusion dominavam o espaço. A rápida melhoria na qualidade da imagem, a adesão aos prompts e a velocidade de renderização transformou esta categoria em um dos campos de batalha de IA mais contestados.

A adoção de geração de imagens por empresas acelerou substancialmente nos últimos seis meses, de acordo com dados suplementares da indústria, com departamentos de marketing e agências criativas cada vez mais integrando essas ferramentas em seus fluxos de trabalho de produção.

A startup chinesa Kling perturba o mercado de IA de vídeo, desafiando a liderança inicial da Runway

No que diz respeito à geração de vídeo, o laboratório chinês Kuaishou lançou rapidamente a família Kling de modelos, capturando coletivamente cerca de 30% de participação de uso. Notavelmente, o Kling-2.0-Master alcançou 21% de toda a geração de vídeo na Poe até o final de abril, apenas três semanas após seu lançamento.

O Veo 2 do Google manteve uma posição forte com aproximadamente 20% de participação após seu lançamento em fevereiro, enquanto a pioneira da categoria Runway viu sua participação de uso cair substancialmente de cerca de 60% para 20% durante o período de relatório.

A velocidade de penetração de mercado da Kling ressalta o quão rapidamente o cenário competitivo pode mudar em categorias emergentes de IA, onde players estabelecidos podem não manter suas vantagens iniciais à medida que novatos rapidamente iteram e melhoram.

A geração de vídeo continua a ser a aplicação de IA voltada para o consumidor mais intensiva em computação, com modelos exigindo potência significativa de processamento para criar até mesmo clipes curtos. Isso manteve o uso mais limitado do que a geração de texto ou imagem, mas a queda rápida de custos e a melhoria da qualidade devem impulsionar uma adoção mais ampla até 2025.

Os primeiros adotantes empresariais incluem agências de publicidade, criadores de conteúdo de mídia social e plataformas educacionais que começaram a integrar vídeo gerado por IA em suas estratégias de conteúdo, apesar das limitações atuais da tecnologia.

ElevenLabs domina a IA de voz enquanto novos entrantes visam casos de uso especializados

A ElevenLabs continua a liderar a categoria de geração de áudio, atendendo a aproximadamente 80% de todos os pedidos de texto-para-fala dos assinantes durante o período de relatório. No entanto, o relatório destaca a competição emergente de novos concorrentes como Cartesia, Unreal Speech, PlayAI e Orpheus, que oferecem opções de voz diferenciadas, efeitos e modelos de preços.

Essa dominância de mercado por um único player contrasta fortemente com a competição mais fragmentada em outras categorias de IA. Especialistas da indústria atribuem a liderança contínua da ElevenLabs à sua entrada precoce no mercado, biblioteca de vozes extensa e melhorias constantes de qualidade que mantiveram uma vantagem técnica sobre os concorrentes.

Novos entrantes estão encontrando sucesso ao direcionar nichos de mercado específicos. A Unreal Speech ganhou espaço com produtores de podcast e editores de audiolivros ao oferecer atores de voz especializados e capacidades de emoção. Enquanto isso, a Cartesia focou em vozes multilíngues com sotaques autênticos, atraindo o interesse de empresas globais e plataformas educacionais.

O mercado de IA de áudio deve crescer substancialmente até 2025, à medida que as capacidades de texto-para-fala se aproximam da qualidade humana e encontram aplicações em serviços ao cliente, soluções de acessibilidade e criação de conteúdo. Os requisitos computacionais relativamente baixos em comparação com a geração de vídeo permitem uma implantação e experimentação mais amplas.

Implicações Estratégicas para Empresas Navegando em um Cenário de IA em Constante Mudança

A dinâmica do cenário de modelos de IA apresenta oportunidades e desafios para empresas que integram essas tecnologias.

“Pode ser desafiador acompanhar as novidades em IA e o ritmo só está acelerando,” disse Huber ao VentureBeat. “Se você é uma empresa que já utiliza IA em grande escala, investir em pipelines de avaliação robustos e independentes do fornecedor é crítico, pois o modelo que é o melhor este mês pode ser o segundo melhor no próximo mês.”

Essa volatilidade nas preferências de modelos sublinha o valor de plataformas como a Poe, que oferecem acesso a múltiplos modelos por meio de uma única interface, permitindo aos usuários comparar resultados e se adaptar ao ecossistema de IA em mudança.

Analistas da indústria sugerem que a crescente importância de capacidades de raciocínio pode sinalizar uma mudança na forma como as empresas avaliam e implementam modelos de IA, com um foco crescente em precisão e confiabilidade para tarefas complexas em vez de apenas velocidade ou eficiência de custo.

À medida que laboratórios de ponta continuam a lançar modelos mais capazes a um ritmo acelerado, as empresas enfrentam decisões difíceis sobre quando padronizar em plataformas específicas versus manter a flexibilidade. Muitos líderes de IA empresarial estão adotando uma abordagem de portfólio, usando modelos diferentes para tarefas diferentes enquanto mantêm a capacidade de trocar de fornecedor à medida que as capacidades evoluem.

“Este será um espaço importante a ser observado, especialmente entre os fornecedores de ponta, pois representa o melhor que a IA pode alcançar atualmente,” observou Huber em relação aos modelos de raciocínio.

O relatório indica que as capacidades multimídia também estão se tornando cada vez mais competitivas, sugerindo que a geração de texto, há muito o foco principal do desenvolvimento de IA, pode estar cedendo lugar a um ecossistema mais equilibrado onde a geração de imagem, vídeo e áudio desempenham papéis igualmente importantes.

As empresas que navegarem com sucesso por esse complexo cenário provavelmente serão aquelas que mantiverem estruturas de avaliação focadas em casos de uso específicos em vez de correr atrás das últimas novidades em modelos, enquanto simultaneamente constroem uma infraestrutura técnica que permita uma rápida adoção quando melhorias significativas surgirem.

À medida que os modelos de IA continuam seu jogo de cadeiras musicais no topo das classificações, uma coisa se torna clara: no mercado de hoje, a coroa raramente permanece na mesma cabeça por muito tempo — e as empresas que apostam seu futuro no campeão de IA de ontem podem se ver alinhadas com o perdedor de amanhã.





    dezenove + 15 =




    Bolt42