Junte-se aos nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA líder da indústria. Saiba mais
Se não estava claro antes, agora é definitivamente muito evidente: o código aberto realmente importa para a IA. O sucesso do DeepSeek-R1 provou substancialmente que há uma necessidade e uma demanda por IA de código aberto.
Mas o que exatamente é IA de código aberto? Para a Meta e seus modelos Llama, isso significa acesso gratuito para usar o modelo, com algumas condições. O DeepSeek está disponível sob uma licença de código aberto permissiva, com o código do modelo aberto e disponível para qualquer um usar. No entanto, nenhum dos dois enfoques permite acesso total e incondicional a todo o código do modelo, incluindo pesos e dados de treinamento. Sem todas essas informações, os desenvolvedores ainda podem trabalhar com o modelo aberto, mas não têm todas as ferramentas e percepções necessárias para entender como funciona realmente e, mais importante, como construir um modelo totalmente novo. Esse é um desafio que uma nova startup liderada por ex-veteranos de IA do Google e da Apple visa resolver.
Lançando hoje, Oumi é apoiado por uma aliança de 13 universidades de pesquisa de ponta, incluindo Princeton, Stanford, MIT, UC Berkeley, Universidade de Oxford, Universidade de Cambridge, Universidade de Waterloo e Carnegie Mellon. Os fundadores da Oumi levantaram US$ 10 milhões, uma modesta rodada de sementes que dizem atender às suas necessidades. Enquanto grandes players como a OpenAI contemplam investimentos de US$ 500 bilhões em enormes centros de dados por meio de projetos como Stargate, a Oumi está adotando uma abordagem radicalmente diferente. A plataforma fornece aos pesquisadores e desenvolvedores um kit de ferramentas completo para construir, avaliar e implantar modelos de fundação.
“Mesmo as maiores empresas não conseguem fazer isso sozinhas”, disse Oussama Elachqar, cofundador da Oumi e anteriormente engenheiro de aprendizado de máquina na Apple, à VentureBeat. “Estávamos efetivamente trabalhando em silos dentro da Apple, e há muitos outros silos acontecendo em toda a indústria. Tem que haver uma maneira melhor de desenvolver esses modelos de forma colaborativa.”
O que os modelos de código aberto como DeepSeek e Llama estão faltando
O CEO da Oumi e ex-gerente sênior de engenharia de IA do Google Cloud, Manos Koukoumidis, disse à VentureBeat que os pesquisadores consistentemente lhe dizem que a experimentação em IA se tornou extremamente complexa.
Embora os modelos abertos de hoje sejam um passo à frente, isso não é suficiente. Koukoumidis explicou que, com os atuais modelos de IA “abertos”, como DeepSeek-R1 e Llama, uma organização pode usar o modelo e implantá-lo por conta própria. O que está faltando é que qualquer outra pessoa que queira construir sobre o modelo não sabe exatamente como ele foi construído.
Os fundadores da Oumi acreditam que essa falta de transparência é um grande obstáculo para a pesquisa e desenvolvimento colaborativos em IA. Mesmo um projeto como Llama requer uma quantidade significativa de esforço dos pesquisadores para descobrir como reproduzir e construir sobre o trabalho.
Como a Oumi trabalha para abrir a IA para usuários empresariais, pesquisadores e todos os outros
A plataforma Oumi funciona fornecendo um ambiente tudo-em-um que simplifica os complexos fluxos de trabalho envolvidos na construção de modelos de IA.
Koukoumidis explicou que, para construir um modelo de fundação, normalmente há 10 ou mais etapas que precisam ser feitas, muitas vezes em paralelo. A Oumi integra todas as ferramentas e fluxos de trabalho necessários em um ambiente unificado, eliminando a necessidade de os pesquisadores montarem e configurarem vários componentes de código aberto.
Os principais recursos técnicos incluem:
- Apoio para modelos variando de 10M a 405B parâmetros
- Implementação de técnicas de treinamento avançadas, incluindo SFT, LoRA, QLoRA e DPO
- Compatibilidade com modelos de texto e multimodais
- Ferramentas integradas para síntese e curadoria de dados de treinamento usando juízes LLM
- Opções de implantação por meio de motores de inferência modernos, como vLLM e SGLang
- Avaliação abrangente de modelos em benchmarks padrão da indústria
“Não precisamos lidar com o inferno do desenvolvimento de código aberto de descobrir o que você pode combinar e o que funciona bem,” explicou Koukoumidis.
A plataforma permite que os usuários comecem pequeno, usando seus próprios laptops para experimentos iniciais e treinamento de modelos. Conforme os usuários progridem, eles podem aumentar para recursos computacionais maiores, como clusters universitários ou provedores de nuvem, tudo dentro do mesmo ambiente Oumi.
Você não precisa de infraestrutura massiva de treinamento para construir um modelo aberto
Uma das grandes surpresas com o DeepSeek-R1 é o fato de que foi aparentemente construído com uma fração dos recursos que a Meta ou a OpenAI usam para construir seus modelos.
Enquanto a OpenAI e outros investem bilhões em infraestrutura centralizada, a Oumi aposta em uma abordagem distribuída que pode reduzir dramaticamente os custos.
“A ideia de que você precisa de centenas de bilhões [de dólares] para a infraestrutura da IA é fundamentalmente falha,” afirmou Koukoumidis. “Com computação distribuída entre universidades e instituições de pesquisa, podemos alcançar resultados semelhantes ou melhores por uma fração do custo.”
O foco inicial da Oumi é construir o ecossistema de código aberto de usuários e desenvolvimento. Mas isso não é tudo o que a empresa tem planejado. A Oumi pretende desenvolver ofertas empresariais para ajudar as empresas a implantar esses modelos em ambientes produtivos.
Percepções diárias sobre casos de uso empresarial com VB Daily
Se você quiser impressionar seu chefe, o VB Daily tem tudo o que você precisa. Nós lhe damos a informação privilegiada sobre o que as empresas estão fazendo com a IA generativa, desde mudanças regulatórias até implantações práticas, para que você possa compartilhar percepções para um ROI máximo.
Leia nossa Política de Privacidade
Obrigado por se inscrever. Confira mais boletins da VB aqui.
Ocorreu um erro.
Conteúdo relacionado
A plataforma de música gratuita da Riffusion pode ser o Spotify do futuro
[the_ad id="145565"] Participe de nossas newsletters diárias e semanais para obter as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA de ponta. Saiba Mais…
A startup de análise de dados Athenic AI quer ser o sistema nervoso central da empresa.
[the_ad id="145565"] Jared Zhao se interessou por análise de dados durante sua passagem pela UC Berkeley, atraído pela capacidade de transformar dados brutos em histórias. Zhao…
Mistral Small 3 leva IA de código aberto às massas — menor, mais rápido e mais barato
[the_ad id="145565"] Inscreva-se em nossas newsletters diárias e semanais para as últimas atualizações e conteúdo exclusivo sobre cobertura de IA de ponta. Saiba Mais……