Bolt42

A empresa chinesa de tecnologia Alibaba anunciou na segunda-feira o lançamento do Qwen3, uma família de modelos de IA que a empresa afirma igualar e, em alguns casos, superar os melhores modelos disponíveis da Google e OpenAI.

A maioria dos modelos estará — ou estará disponível em breve — para download sob uma licença “aberta” na plataforma de desenvolvimento de IA Hugging Face e GitHub. Eles variam em tamanho de 0,6 bilhões a 235 bilhões de parâmetros. Parâmetros correspondem aproximadamente às habilidades de resolução de problemas de um modelo, e modelos com mais parâmetros geralmente têm desempenho melhor do que aqueles com menos parâmetros.

O surgimento de séries de modelos originados na China, como o Qwen, aumentou a pressão sobre laboratórios americanos, como a OpenAI, para entregar tecnologias de IA mais capazes. Eles também levaram os formuladores de políticas a implementar restrições visando limitar a capacidade das empresas de IA chinesas de obter os chips necessários para treinar modelos.

De acordo com a Alibaba, os modelos Qwen3 são modelos “híbridos” no sentido de que podem levar tempo e “raciocinar” sobre problemas complexos ou responder rapidamente a solicitações mais simples. O raciocínio permite que os modelos verifiquem efetivamente a si mesmos, semelhante aos modelos como o o3 da OpenAI, mas com o custo de maior latência.

“Integramos de forma transparente modos de pensar e não pensar, oferecendo aos usuários flexibilidade para controlar o orçamento de pensamento”, escreveu a equipe do Qwen em um postagem no blog. “Esse design permite que os usuários configurem orçamentos específicos de tarefas com facilidade.”

Alguns dos modelos também adotam uma arquitetura de mistura de especialistas (MoE), que pode ser mais eficiente em termos computacionais para responder a consultas. O MoE divide tarefas em subtarefas e as delega a modelos “especialistas” menores e especializados.

Os modelos Qwen3 suportam 119 idiomas, afirma a Alibaba, e foram treinados em um conjunto de dados de quase 36 trilhões de tokens. Tokens são os bits brutos de dados que um modelo processa; 1 milhão de tokens equivale a cerca de 750.000 palavras. A Alibaba afirma que o Qwen3 foi treinado com uma combinação de livros didáticos, “pares de perguntas e respostas”, trechos de código, dados gerados por IA, entre outros.

Essas melhorias, junto com outras, aumentaram significativamente as capacidades do Qwen3 em comparação com seu antecessor, Qwen2, diz a Alibaba. Nenhum dos modelos Qwen3 está muito à frente dos modelos mais recentes de ponta, como o o3 e o o4-mini da OpenAI, mas eles ainda são fortes competidores.

Na Codeforces, uma plataforma para concursos de programação, o maior modelo Qwen3 — Qwen-3-235B-A22B — acaba superando o o3-mini da OpenAI e o Gemini 2.5 Pro da Google. O Qwen-3-235B-A22B também supera o o3-mini na versão mais recente do AIME, um benchmark desafiador de matemática, e no BFCL, um teste para avaliar a capacidade de um modelo de “raciocinar” sobre problemas.

Mas o Qwen-3-235B-A22B não está disponível ao público — pelo menos não ainda.

Resultados de benchmarks do Alibaba Qwen 3
Resultados de benchmark internos da Alibaba para o Qwen3.Créditos da Imagem: Alibaba

O maior modelo Qwen3 disponível publicamente, Qwen3-32B, ainda é competitivo com vários modelos de IA proprietários e abertos, incluindo o R1 do laboratório de IA chinês DeepSeek. O Qwen3-32B supera o modelo o1 da OpenAI em diversos testes, incluindo o benchmark de codificação LiveCodeBench.

A Alibaba afirma que o Qwen3 “se destaca” em capacidades de chamada de ferramentas, bem como em seguir instruções e copiar formatos de dados específicos. Além dos modelos para download, o Qwen3 está disponível em provedores de nuvem, incluindo Fireworks AI e Hyperbolic.

Tuhin Srivastava, cofundador e CEO da plataforma de nuvem de IA Baseten, comentou que o Qwen3 é mais um ponto na linha de tendência de modelos abertos que acompanham sistemas de código fechado, como os da OpenAI.

“Os EUA estão intensificando as restrições à venda de chips para a China e às compras da China, mas modelos como o Qwen 3, que são de ponta e abertos… certamente serão usados internamente”, disse ele ao TechCrunch. “Isso reflete a realidade de que as empresas estão tanto construindo suas próprias ferramentas quanto comprando modelos de empresas fechadas, como Anthropic e OpenAI.”


    cinco × quatro =

    Bolt42