Bolt42

Participe das nossas newsletters diárias e semanais para receber as últimas atualizações e conteúdos exclusivos sobre cobertura de IA de ponta. Saiba mais


Alibaba Cloud lançou o Qwen2.5-Coder, um novo assistente de codificação por IA que já se tornou a segunda demonstração mais popular no Hugging Face Spaces. Testes iniciais sugerem que seu desempenho rivaliza com o GPT-4o, e está disponível para desenvolvedores sem custo.

A liberação inclui seis variantes de modelo, desde 0,5 bilhões até 32 bilhões de parâmetros, tornando a codificação avançada em IA acessível a desenvolvedores com diferentes recursos de computação. Essa conquista da empresa de tecnologia chinesa ocorre apesar das restrições de exportação em semicondutores avançados.

De acordo com o relatório técnico da equipe no arXiv, o sucesso do Qwen2.5-Coder resulta de um processamento de dados refinado, geração de dados sintéticos e conjuntos de dados balanceados, resultando em uma geração de código robusta enquanto mantém capacidades mais amplas.

Uma comparação de modelos de codificação por IA mostra que o Qwen2.5-Coder-32B da Alibaba (em azul) supera o GPT-4 e outros concorrentes em vários benchmarks da indústria. Fonte: Pesquisa Alibaba Cloud

Desempenho de ponta aumenta a competitividade na corrida global de IA

O modelo principal, Qwen2.5-Coder-32B-Instruct, quebrou benchmarks anteriores para assistentes de codificação de código aberto. Ele obteve 92,7% no HumanEval e 90,2% no MBPP, duas métricas cruciais para medir as habilidades de geração de código. O mais impressionante é que alcançou 31,4% de precisão no LiveCodeBench, um benchmark contemporâneo que testa modelos de IA em desafios de programação do mundo real.

A conquista vai muito além das métricas de desempenho típicas. Enquanto a maioria dos assistentes de codificação por IA se especializa em uma ou duas linguagens populares como Python ou JavaScript, a maestria do Qwen2.5-Coder em 92 linguagens de programação — desde ferramentas comuns até linguagens de nicho, como Haskell e Racket — representa um grande avanço na versatilidade da IA.

Esse amplo suporte a idiomas, combinado com sua capacidade de lidar com tarefas complexas como conclusão de código em nível de repositório e depuração, sugere que estamos entrando em uma nova era em que os assistentes de codificação por IA podem realmente funcionar como parceiros de programação universais, em vez de apenas ferramentas especializadas.

Resultados de benchmark comparando o Qwen2.5-Coder da Alibaba com os principais modelos de IA, incluindo GPT-4 e Claude 3.5. O novo modelo (coluna mais à esquerda) alcança as melhores pontuações em várias métricas chave, incluindo uma taxa de precisão de 92,7% no HumanEval, superando concorrentes de código aberto e proprietários. Fonte: Pesquisa Alibaba Cloud

Estratégia de código aberto pode reformular o desenvolvimento de software empresarial

Diferentemente de seus concorrentes de código fechado, a maioria dos modelos Qwen2.5-Coder possui a licença Apache 2.0, permitindo que as empresas os integrem livremente em seus produtos. Isso pode reduzir dramaticamente os custos de desenvolvimento para empresas em todo o mundo, acelerando a adoção de IA.

As capacidades do modelo vão além da codificação básica. Ele se destaca na conclusão de código em nível de repositório, compreende o contexto em vários arquivos e pode gerar aplicativos visuais como websites e visualizações de dados.

“Exploramos a praticidade do Qwen2.5-Coder em dois cenários, incluindo assistentes de código e Artefatos, com alguns exemplos mostrando as aplicações potenciais em cenários do mundo real”, explicaram os pesquisadores em seu artigo.

Inovação em IA da China desafia restrições de chips dos EUA

Esse lançamento pode alterar fundamentalmente a economia do desenvolvimento de software assistido por IA. Enquanto empresas como OpenAI e Anthropic construíram seus modelos de negócios em torno do acesso por assinatura a modelos proprietários, a decisão da Alibaba de abrir o Qwen2.5-Coder cria uma nova dinâmica.

Clientes empresariais que atualmente pagam centenas de milhares de dólares anualmente por assistência em codificação por IA podem logo ter acesso a capacidades comparáveis a uma fração do custo.

Isso não apenas desafia modelos de negócios existentes – mas também pode acelerar a adoção de IA entre pequenas empresas e desenvolvedores em mercados emergentes que foram excluídos da atual onda de IA.

A mudança em direção a ferramentas de IA de código aberto para empresas também levanta questões estratégicas para empresas de tecnologia ocidentais. À medida que alternativas de código aberto mais sofisticadas surgem, manter modelos de assinatura de alto preço para serviços de IA pode se tornar cada vez mais difícil de justificar para clientes empresariais.

A conquista é particularmente importante dada as restrições contínuas dos EUA sobre a exportação de chips para a China. O sucesso da Alibaba sugere que as empresas de tecnologia chinesas encontraram maneiras de inovar apesar dessas limitações, possivelmente reformulando o cenário competitivo global em IA.

A liberação do modelo intensifica a corrida pelo desenvolvimento de IA entre os EUA e a China. Enquanto empresas americanas tradicionalmente lideravam em modelos de linguagem grande, empresas chinesas estão cada vez mais igualando ou superando suas capacidades em domínios especializados como codificação e matemática.

Os pesquisadores da Alibaba planejam explorar aumentar tanto o tamanho dos dados quanto o tamanho do modelo, além de aprimorar as capacidades de raciocínio. Isso sugere que a empresa não está satisfeita com os resultados atuais e visa expandir ainda mais os limites.

Para desenvolvedores e empresas em todo o mundo, Qwen2.5-Coder apresenta uma nova opção no conjunto de ferramentas de IA — que combina desempenho de ponta com a liberdade de software de código aberto. À medida que a corrida de armamentos em IA continua a acelerar, esse lançamento pode marcar uma mudança na forma como as capacidades avançadas de IA são distribuídas e acessadas globalmente.





    4 × three =




    Bolt42