AI2 fecha a lacuna entre o pós-treinamento de código fechado e código aberto

Participe de nossas newsletters diárias e semanais para obter as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA líder na indústria. Saiba mais

O Allen Institute for AI (Ai2) afirma ter reduzido a diferença entre modelos de treinamento fechado e aberto com o lançamento de sua nova família de modelos, Tülu 3, sustentando que modelos de código aberto prosperarão no espaço empresarial.

O Tülu 3 coloca modelos de código aberto em pé de igualdade com os modelos GPT da OpenAI, Claude da Anthropic e Gemini do Google. Ele permite que pesquisadores, desenvolvedores e empresas ajustem modelos de código aberto sem perder dados e habilidades fundamentais do modelo, aproximando-se da qualidade dos modelos de código fechado.

A Ai2 disse que lançou o Tülu 3 com todos os dados, combinações de dados, receitas, código, infraestrutura e quadros de avaliação. A empresa precisou criar novos conjuntos de dados e métodos de treinamento para melhorar o desempenho do Tülu, incluindo “treinamento direto em problemas verificáveis com aprendizado por reforço.”

“Nossos melhores modelos resultam de um complexo processo de treinamento que integra detalhes parciais de métodos proprietários com técnicas novas e pesquisa acadêmica estabelecida,” disse a Ai2 em um postagem no blog. “Nosso sucesso está enraizado em uma cuidadosa curadoria de dados, experimentação rigorosa, metodologias inovadoras e infraestrutura de treinamento aprimorada.”

O Tülu 3 estará disponível em uma variedade de tamanhos.

Código aberto para empresas

Modelos de código aberto muitas vezes ficaram atrás dos modelos de código fechado em adoção empresarial, embora mais empresas tenham relatado, anedoticamente, a escolha de modelos de linguagem de código aberto (LLMs) para projetos.

A tese da Ai2 é que melhorar o ajuste fino com modelos de código aberto como o Tülu 3 aumentará o número de empresas e pesquisadores que optam por modelos de código aberto porque podem ter confiança de que ele pode desempenhar tão bem quanto um Claude ou Gemini.

A empresa aponta que Tülu 3 e outros modelos da Ai2 são totalmente de código aberto, observando que grandes treinadores de modelos, como Anthropic e Meta, que afirmam ser de código aberto, têm “nenhum de seus dados de treinamento nem receitas de treinamento são transparentes para os usuários.” A Open Source Initiative publicou recentemente a primeira versão de sua definição de IA de código aberto, mas algumas organizações e provedores de modelos não seguem completamente a definição em suas licenças.

As empresas se importam com a transparência dos modelos, mas muitas escolhem modelos de código aberto não tanto pela abertura em pesquisa ou dados, mas porque é o melhor ajuste para seus casos de uso.

O Tülu 3 oferece às empresas mais opções ao procurar modelos de código aberto para integrar em sua pilha e ajustar com seus dados.

Outros modelos da Ai2, OLMoE e Molmo, também são de código aberto, e a empresa afirmou que esses modelos começaram a superar outros modelos líderes como o GPT-4 e o Claude.

Outras características do Tülu 3

A Ai2 afirmou que o Tülu 3 permite que as empresas misturem e combinem seus dados durante o ajuste fino.

“As receitas ajudam você a balancear os conjuntos de dados, então, se você quiser construir um modelo que possa codificar, mas também seguir instruções com precisão e falar em vários idiomas, você simplesmente seleciona os conjuntos de dados particulares e segue os passos na receita,” disse a Ai2.

A mistura e combinação de conjuntos de dados pode facilitar para os desenvolvedores a transição de um modelo menor para um maior e ponderado, mantendo suas configurações pós-treinamento. A empresa disse que o código de infraestrutura lançado com o Tülu 3 permite que as empresas construam esse pipeline ao mudar entre tamanhos de modelos.

O quadro de avaliação da Ai2 oferece uma maneira para os desenvolvedores especificarem configurações sobre o que desejam extrair do modelo.

VB Daily

Mantenha-se informado! Receba as últimas notícias em sua caixa de entrada diariamente.

Ao se inscrever, você concorda com os Termos de Serviço da VentureBeat.

Obrigado por se inscrever. Confira mais newsletters da VB aqui.

Ocorreu um erro.

Conteúdo relacionado

Inteligência artificial

AI2 fecha a lacuna entre o pós-treinamento de código fechado e código aberto

Código aberto para empresas

Outras características do Tülu 3

Conteúdo relacionado

Iniciativa DOGE de Elon Musk: A IA pode decidir quais empregos federais cortar?

Gladia Unveils Solaria: An AI-Powered Multilingual Speech Recognition Model for Portuguese Speech-to-Text Transcription

Augment Code lança agente de IA com taxa de vitória de 70% sobre o GitHub Copilot e recorde histórico no SWE-bench