Novo modelo matemático de código aberto Light-R1-32B supera o desempenho equivalente do DeepSeek com apenas $1000 em custos de treinamento.

Sure! Here’s the rewritten content in Portuguese, while retaining the HTML tags:

<div>
    <div id="boilerplate_2682874" class="post-boilerplate boilerplate-before"><!-- wp:paragraph -->
<p><em>Participe de nossas newsletters diárias e semanais para obter as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA líder de mercado. Saiba mais</em></p>
<!-- /wp:paragraph -->

<!-- wp:separator {"opacity":"css","className":"is-style-wide"} -->
<hr class="wp-block-separator has-css-opacity is-style-wide"/>
<!-- /wp:separator --></div><p>Uma equipe de pesquisadores apresentou o Light-R1-32B, um novo modelo de IA de código aberto otimizado para resolver problemas matemáticos avançados, disponível no <a target="_blank" href="https://huggingface.co/qihoo360/Light-R1-32B">Hugging Face</a> sob uma licença permissiva Apache 2.0 — gratuito para empresas e pesquisadores usarem, implantar, ajustar ou modificar conforme desejarem, mesmo para fins comerciais.</p>

<p>O modelo com 32 bilhões de parâmetros (número de configurações do modelo) supera o desempenho de modelos de código aberto de tamanho semelhante (e até maiores), como DeepSeek-R1-Distill-Llama-70B e DeepSeek-R1-Distill-Qwen-32B, em um benchmark de terceiros chamado <a target="_blank" href="https://artofproblemsolving.com/wiki/index.php/American_Invitational_Mathematics_Examination?srsltid=AfmBOorV1herNQ7lNj3AhsG6mX2wsiwHisrOS9vg-t2qYB77HTv-e-Ou" target="_blank" rel="noreferrer noopener">Exame de Matemática Convocativo Americano (AIME)</a>, que contém 15 problemas matemáticos projetados para estudantes extremamente avançados e possui um limite de tempo de 3 horas para usuários humanos.</p>

<figure class="wp-block-image size-full is-resized"><img fetchpriority="high" decoding="async" width="599" height="325" src="https://venturebeat.com/wp-content/uploads/2025/03/Screenshot-2025-03-05-at-2.17.52%E2%80%AFPM.png" alt="" class="wp-image-2998844" style="width:840px;height:auto"  /></figure>

<p>Desenvolvido por Liang Wen, Fenrui Xiao, Xin He, Yunke Cai, Qi An, Zhenyu Duan, Yimin Du, Junchen Liu, Lifu Tang, Xiaowei Lv, Haosheng Zou, Yongchao Deng, Shousheng Jia e Xiangzheng Zhang, o modelo supera alternativas de código aberto anteriores em benchmarks matemáticos competitivos.</p>

<p>Incrivelmente, os pesquisadores completaram o treinamento do modelo em menos de seis horas em 12 GPUs Nvidia H800 a um custo estimado de $1.000. Isso faz do Light-R1-32B uma das abordagens mais acessíveis e práticas para desenvolver modelos de IA de alta performance especializados em matemática. No entanto, é importante lembrar que o modelo foi treinado em uma variante do <a target="_blank" href="https://huggingface.co/Qwen/Qwen2.5-32B-Instruct" target="_blank" rel="noreferrer noopener">Qwen 2.5-32B-Instruct de código aberto da Alibaba</a>, que presumivelmente teve custos de treinamento iniciais muito mais altos.</p>

<p>Juntamente com o modelo, a equipe também lançou seus conjuntos de dados de treinamento, scripts de treinamento e ferramentas de avaliação, proporcionando uma estrutura transparente e acessível para a construção de modelos de IA focados em matemática.</p>

<p>A chegada do Light-R1-32B segue outros esforços semelhantes de concorrentes como a Microsoft com sua série Orca-Math.</p>

<h2 class="wp-block-heading" id="h-a-new-math-king-emerges">Um novo rei da matemática surge</h2>

<p>O Light-R1-32B foi projetado para lidar com raciocínio matemático complexo, particularmente nos benchmarks do AIME (Exame de Matemática Convocativo Americano).</p>

<p>Foi treinado a partir do Qwen2.5-32B-Instruct, começando com um modelo que não tinha raciocínio de longo encadeamento (COT). A equipe aplicou o fine-tuning supervisionado baseado em currículo (SFT) e a Otimização de Preferência Direta (DPO) para aprimorar suas capacidades de resolução de problemas.</p>

<p>Quando avaliado, o Light-R1-32B alcançou 76,6 no AIME24 e 64,6 no AIME25, superando o DeepSeek-R1-Distill-Qwen-32B, que marcou 72,6 e 54,9, respectivamente.</p>

<p>Essa melhoria sugere que a abordagem de treinamento baseada em currículo melhora efetivamente o raciocínio matemático, mesmo quando treinada a partir de modelos que inicialmente carecem de long COT.</p>

<h2 class="wp-block-heading" id="h-fair-benchmarking">Benchmarking justo</h2>

<p>Para garantir uma avaliação justa, a equipe descontaminou os dados de treinamento contra benchmarks comuns de raciocínio, incluindo AIME24/25, MATH-500 e GPQA Diamond, prevenindo vazamento de dados.</p>

<p>Além disso, implementaram uma filtragem de respostas baseada em dificuldade usando o DeepScaleR-1.5B-Preview, resultando em um conjunto de 76.000 exemplos para a primeira fase de fine-tuning supervisionado. Um segundo conjunto mais desafiador de 3.000 exemplos melhorou ainda mais o desempenho.</p>

<p>Após o treinamento, a equipe mesclou várias versões treinadas do Light-R1-32B, levando a ganhos adicionais. Notavelmente, o modelo mantém fortes habilidades de generalização em tarefas de raciocínio científico (GPQA), apesar de ser especializado em matemática.</p>

<h2 class="wp-block-heading" id="h-how-enterprises-can-benefit">Como as empresas podem se beneficiar</h2>

<p>O Light-R1-32B é liberado sob a Licença Apache 2.0, uma licença de código aberto permissiva que permite uso, modificação e implantação comercial gratuitas, sem exigir que as obras derivadas sejam de código aberto.</p>

<p>Isso o torna uma opção atraente para empresas, desenvolvedores de IA e engenheiros de software que buscam integrar ou personalizar o modelo para aplicações proprietárias.</p>

<p>A licença também inclui uma concessão de patente mundial e livre de royalties, reduzindo riscos legais para empresas enquanto desencoraja disputas de patentes. As empresas podem implantar livremente o Light-R1-32B em produtos comerciais, mantendo total controle sobre suas inovações, ao mesmo tempo que se beneficiam de um ecossistema de IA aberto e transparente.</p>

<p>Para CEOs, CTOs e líderes de TI, a Apache 2.0 garante eficiência de custos e independência de fornecedores, eliminando taxas de licença e dependências restritivas de soluções de IA proprietárias. Desenvolvedores e engenheiros de IA ganham flexibilidade para ajustar, integrar e estender o modelo sem limitações, tornando-o ideal para raciocínio matemático especializado, pesquisa e aplicações de IA corporativa. No entanto, como a licença não fornece garantia ou cobertura de responsabilidade, as organizações devem realizar suas próprias avaliações de segurança, conformidade e desempenho antes de implantar o Light-R1-32B em ambientes críticos.</p>

<h2 class="wp-block-heading" id="h-transparency-in-low-cost-training-and-optimization-for-math-problem-solving">Transparência em treinamento de baixo custo e otimização para resolução de problemas matemáticos</h2>

<p>Os pesquisadores enfatizam que o Light-R1-32B oferece uma maneira validada e econômica de treinar modelos robustos de longo encadeamento de pensamento em domínios especializados.</p>

<p>Ao compartilhar sua metodologia, dados de treinamento e código, eles visam reduzir as barreiras de custo para o desenvolvimento de IA de alto desempenho.</p>

<p>Trabalhos futuros incluem explorar o aprendizado por reforço (RL) para aprimorar ainda mais as capacidades de raciocínio do modelo.</p>

<div id="boilerplate_2660155" class="post-boilerplate boilerplate-after"><!-- wp:shortcode -->
        <div class="Boilerplate__newsletter-container vb">
            <div class="Boilerplate__newsletter-main">
                <p><strong>Insights diários sobre casos de uso empresarial com VB Daily</strong></p>
                <p class="copy">Se você deseja impressionar seu chefe, o VB Daily tem tudo para você. Oferecemos a você as informações internas sobre o que as empresas estão fazendo com a IA generativa, desde mudanças regulatórias até implantações práticas, para que você possa compartilhar insights para maximizar o ROI.</p>

                <p class="Form__newsletter-legal">Leia nossa Política de Privacidade</p>
                <p class="Form__success" id="boilerplateNewsletterConfirmation">
                    Obrigado por se inscrever. Confira mais newsletters da VB aqui.
                </p>
                <p class="Form__error">Ocorreu um erro.</p>
            </div>

                            <div class="image-container">
                    <img src="https://venturebeat.com/wp-content/themes/vb-news/brand/img/vb-daily-phone.png" alt=""/>
                </div>

        </div>

<!-- /wp:shortcode --></div>            
</div>

Let me know if you need any further assistance!

Conteúdo relacionado

BusinessInteligência artificial

A Revolução da Interoperabilidade: Como o MCP Está se Tornando a Linguagem Universal da IA Empresarial

[the_ad id="145565"] Here's the rewritten content in Portuguese with the original HTML tags preserved: <div> <div id="boilerplate_2682874" class="post-boilerplate…

BusinessInteligência artificial

O DJ de IA do Spotify agora permite que você use comandos de voz para personalizar suas músicas

[the_ad id="145565"] Com o objetivo de tornar seu DJ de IA mais interativo, o Spotify está atualizando o recurso para permitir que os usuários solicitem música ou mudem o clima…

BusinessInteligência artificial

Audible está expandindo sua biblioteca de audiolivros narrados por IA.

[the_ad id="145565"] Audible, o serviço de audiolivros da Amazon, anunciou na terça-feira que está se unindo a editores selecionados para converter livros impressos e e-books…