Novo modelo matemático de código aberto Light-R1-32B supera o desempenho equivalente do DeepSeek com apenas $1000 em custos de treinamento.

Sure! Here’s the rewritten content in Portuguese, while retaining the HTML tags:

<div>
    <div id="boilerplate_2682874" class="post-boilerplate boilerplate-before"><!-- wp:paragraph -->
<p><em>Participe de nossas newsletters diárias e semanais para obter as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA líder de mercado. Saiba mais</em></p>
<!-- /wp:paragraph -->

<!-- wp:separator {"opacity":"css","className":"is-style-wide"} -->
<hr class="wp-block-separator has-css-opacity is-style-wide"/>
<!-- /wp:separator --></div><p>Uma equipe de pesquisadores apresentou o Light-R1-32B, um novo modelo de IA de código aberto otimizado para resolver problemas matemáticos avançados, disponível no <a target="_blank" href="https://huggingface.co/qihoo360/Light-R1-32B">Hugging Face</a> sob uma licença permissiva Apache 2.0 — gratuito para empresas e pesquisadores usarem, implantar, ajustar ou modificar conforme desejarem, mesmo para fins comerciais.</p>

<p>O modelo com 32 bilhões de parâmetros (número de configurações do modelo) supera o desempenho de modelos de código aberto de tamanho semelhante (e até maiores), como DeepSeek-R1-Distill-Llama-70B e DeepSeek-R1-Distill-Qwen-32B, em um benchmark de terceiros chamado <a target="_blank" href="https://artofproblemsolving.com/wiki/index.php/American_Invitational_Mathematics_Examination?srsltid=AfmBOorV1herNQ7lNj3AhsG6mX2wsiwHisrOS9vg-t2qYB77HTv-e-Ou" target="_blank" rel="noreferrer noopener">Exame de Matemática Convocativo Americano (AIME)</a>, que contém 15 problemas matemáticos projetados para estudantes extremamente avançados e possui um limite de tempo de 3 horas para usuários humanos.</p>

<figure class="wp-block-image size-full is-resized"><img fetchpriority="high" decoding="async" width="599" height="325" src="https://venturebeat.com/wp-content/uploads/2025/03/Screenshot-2025-03-05-at-2.17.52%E2%80%AFPM.png" alt="" class="wp-image-2998844" style="width:840px;height:auto"  /></figure>

<p>Desenvolvido por Liang Wen, Fenrui Xiao, Xin He, Yunke Cai, Qi An, Zhenyu Duan, Yimin Du, Junchen Liu, Lifu Tang, Xiaowei Lv, Haosheng Zou, Yongchao Deng, Shousheng Jia e Xiangzheng Zhang, o modelo supera alternativas de código aberto anteriores em benchmarks matemáticos competitivos.</p>

<p>Incrivelmente, os pesquisadores completaram o treinamento do modelo em menos de seis horas em 12 GPUs Nvidia H800 a um custo estimado de $1.000. Isso faz do Light-R1-32B uma das abordagens mais acessíveis e práticas para desenvolver modelos de IA de alta performance especializados em matemática. No entanto, é importante lembrar que o modelo foi treinado em uma variante do <a target="_blank" href="https://huggingface.co/Qwen/Qwen2.5-32B-Instruct" target="_blank" rel="noreferrer noopener">Qwen 2.5-32B-Instruct de código aberto da Alibaba</a>, que presumivelmente teve custos de treinamento iniciais muito mais altos.</p>

<p>Juntamente com o modelo, a equipe também lançou seus conjuntos de dados de treinamento, scripts de treinamento e ferramentas de avaliação, proporcionando uma estrutura transparente e acessível para a construção de modelos de IA focados em matemática.</p>

<p>A chegada do Light-R1-32B segue outros esforços semelhantes de concorrentes como a Microsoft com sua série Orca-Math.</p>

<h2 class="wp-block-heading" id="h-a-new-math-king-emerges">Um novo rei da matemática surge</h2>

<p>O Light-R1-32B foi projetado para lidar com raciocínio matemático complexo, particularmente nos benchmarks do AIME (Exame de Matemática Convocativo Americano).</p>

<p>Foi treinado a partir do Qwen2.5-32B-Instruct, começando com um modelo que não tinha raciocínio de longo encadeamento (COT). A equipe aplicou o fine-tuning supervisionado baseado em currículo (SFT) e a Otimização de Preferência Direta (DPO) para aprimorar suas capacidades de resolução de problemas.</p>

<p>Quando avaliado, o Light-R1-32B alcançou 76,6 no AIME24 e 64,6 no AIME25, superando o DeepSeek-R1-Distill-Qwen-32B, que marcou 72,6 e 54,9, respectivamente.</p>

<p>Essa melhoria sugere que a abordagem de treinamento baseada em currículo melhora efetivamente o raciocínio matemático, mesmo quando treinada a partir de modelos que inicialmente carecem de long COT.</p>

<h2 class="wp-block-heading" id="h-fair-benchmarking">Benchmarking justo</h2>

<p>Para garantir uma avaliação justa, a equipe descontaminou os dados de treinamento contra benchmarks comuns de raciocínio, incluindo AIME24/25, MATH-500 e GPQA Diamond, prevenindo vazamento de dados.</p>

<p>Além disso, implementaram uma filtragem de respostas baseada em dificuldade usando o DeepScaleR-1.5B-Preview, resultando em um conjunto de 76.000 exemplos para a primeira fase de fine-tuning supervisionado. Um segundo conjunto mais desafiador de 3.000 exemplos melhorou ainda mais o desempenho.</p>

<p>Após o treinamento, a equipe mesclou várias versões treinadas do Light-R1-32B, levando a ganhos adicionais. Notavelmente, o modelo mantém fortes habilidades de generalização em tarefas de raciocínio científico (GPQA), apesar de ser especializado em matemática.</p>

<h2 class="wp-block-heading" id="h-how-enterprises-can-benefit">Como as empresas podem se beneficiar</h2>

<p>O Light-R1-32B é liberado sob a Licença Apache 2.0, uma licença de código aberto permissiva que permite uso, modificação e implantação comercial gratuitas, sem exigir que as obras derivadas sejam de código aberto.</p>

<p>Isso o torna uma opção atraente para empresas, desenvolvedores de IA e engenheiros de software que buscam integrar ou personalizar o modelo para aplicações proprietárias.</p>

<p>A licença também inclui uma concessão de patente mundial e livre de royalties, reduzindo riscos legais para empresas enquanto desencoraja disputas de patentes. As empresas podem implantar livremente o Light-R1-32B em produtos comerciais, mantendo total controle sobre suas inovações, ao mesmo tempo que se beneficiam de um ecossistema de IA aberto e transparente.</p>

<p>Para CEOs, CTOs e líderes de TI, a Apache 2.0 garante eficiência de custos e independência de fornecedores, eliminando taxas de licença e dependências restritivas de soluções de IA proprietárias. Desenvolvedores e engenheiros de IA ganham flexibilidade para ajustar, integrar e estender o modelo sem limitações, tornando-o ideal para raciocínio matemático especializado, pesquisa e aplicações de IA corporativa. No entanto, como a licença não fornece garantia ou cobertura de responsabilidade, as organizações devem realizar suas próprias avaliações de segurança, conformidade e desempenho antes de implantar o Light-R1-32B em ambientes críticos.</p>

<h2 class="wp-block-heading" id="h-transparency-in-low-cost-training-and-optimization-for-math-problem-solving">Transparência em treinamento de baixo custo e otimização para resolução de problemas matemáticos</h2>

<p>Os pesquisadores enfatizam que o Light-R1-32B oferece uma maneira validada e econômica de treinar modelos robustos de longo encadeamento de pensamento em domínios especializados.</p>

<p>Ao compartilhar sua metodologia, dados de treinamento e código, eles visam reduzir as barreiras de custo para o desenvolvimento de IA de alto desempenho.</p>

<p>Trabalhos futuros incluem explorar o aprendizado por reforço (RL) para aprimorar ainda mais as capacidades de raciocínio do modelo.</p>

<div id="boilerplate_2660155" class="post-boilerplate boilerplate-after"><!-- wp:shortcode -->
        <div class="Boilerplate__newsletter-container vb">
            <div class="Boilerplate__newsletter-main">
                <p><strong>Insights diários sobre casos de uso empresarial com VB Daily</strong></p>
                <p class="copy">Se você deseja impressionar seu chefe, o VB Daily tem tudo para você. Oferecemos a você as informações internas sobre o que as empresas estão fazendo com a IA generativa, desde mudanças regulatórias até implantações práticas, para que você possa compartilhar insights para maximizar o ROI.</p>

                <p class="Form__newsletter-legal">Leia nossa Política de Privacidade</p>
                <p class="Form__success" id="boilerplateNewsletterConfirmation">
                    Obrigado por se inscrever. Confira mais newsletters da VB aqui.
                </p>
                <p class="Form__error">Ocorreu um erro.</p>
            </div>

                            <div class="image-container">
                    <img src="https://venturebeat.com/wp-content/themes/vb-news/brand/img/vb-daily-phone.png" alt=""/>
                </div>

        </div>

<!-- /wp:shortcode --></div>            
</div>

Let me know if you need any further assistance!

Conteúdo relacionado

BusinessInteligência artificial

O relatório de segurança prometido pela xAI está desaparecido.

[the_ad id="145565"] A empresa de IA de Elon Musk, xAI, perdeu um prazo autoimposto para publicar um framework de segurança de IA finalizado, conforme observado pelo grupo de…

BusinessInteligência artificial

Google testa substituir ‘Estou Sentindo Sorte’ por ‘Modo AI’

[the_ad id="145565"] O Google está testando um redesign em sua página inicial de Pesquisa, no qual o “Modo AI”, o recurso experimental de busca alimentado por IA que a empresa…

BusinessInteligência artificial

Agentes Guardian: Nova abordagem pode reduzir alucinações em IA para abaixo de 1%

[the_ad id="145565"] Participe de nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA de ponta. Saiba mais…