A OpenAI anunciou que pretende lançar seu primeiro modelo de linguagem “aberto” desde o GPT‑2 “nos próximos meses”.
Essa informação vem de um formulário de feedback publicado pela empresa em seu site na segunda-feira. O formulário, que a OpenAI está convidando “desenvolvedores, pesquisadores e [membros da] comunidade mais ampla” a preencher, inclui perguntas como “O que você gostaria de ver em um modelo com pesos abertos da OpenAI?” e “Quais modelos abertos você utilizou no passado?”
“Estamos empolgados para colaborar com desenvolvedores, pesquisadores e a comunidade mais ampla para coletar contribuições e tornar este modelo o mais útil possível”, escreveu a OpenAI em seu site. “Se você tem interesse em participar de uma sessão de feedback com a equipe da OpenAI, por favor nos informe [no formulário] abaixo.”
A OpenAI planeja realizar eventos para desenvolvedores a fim de coletar feedback e, no futuro, apresentar protótipos do modelo. O primeiro evento para desenvolvedores ocorrerá em São Francisco nas próximas semanas, seguido por sessões nas regiões da Europa e Ásia-Pacífico.
estamos lançando um modelo este ano que você pode executar no seu próprio hardware https://t.co/0ji9oezNyr
— Steven Heidel (@stevenheidel) 31 de março de 2025
A OpenAI está enfrentando uma pressão crescente de rivais como o laboratório de IA chinês DeepSeek, que adotaram uma abordagem “aberta” para o lançamento de modelos. Em contraste com a estratégia da OpenAI, esses concorrentes “abertos” disponibilizam seus modelos para a comunidade de IA experimentar e, em alguns casos, comercializar.
Essa estratégia tem se mostrado extremamente bem-sucedida para algumas organizações. A Meta, que investiu pesadamente na sua família de modelos de IA Llama, afirmou no início de março que a Llama já havia registrado mais de 1 bilhão de downloads. Enquanto isso, a DeepSeek rapidamente acumulou uma grande base de usuários em todo o mundo e atraiu a atenção de investidores locais.
Em uma recente sessão de perguntas e respostas no Reddit, o CEO da OpenAI, Sam Altman, disse que acredita que a OpenAI esteve do lado errado da história quando se trata de abrir suas tecnologias.
“[Eu pessoalmente acho que precisamos] descobrir uma estratégia de código aberto diferente,” disse Altman. “Nem todos na OpenAI compartilham essa visão, e também não é nossa prioridade atual […] Vamos produzir modelos melhores [daqui para frente], mas manteremos menos vantagem do que tivemos nos anos anteriores.”
Altman detalhou os planos de modelo aberto da OpenAI em uma publicação no X na tarde de segunda-feira, dizendo que o próximo modelo aberto da OpenAI terá capacidades de “raciocínio” semelhantes às do o3-mini da OpenAI.
“[A]ntes do lançamento, iremos avaliar este modelo de acordo com nossa estrutura de preparação, como faríamos para qualquer outro modelo,” disse Altman. “[E] faremos um trabalho extra sabendo que este modelo será modificado após o lançamento […] [E] estamos animados para ver o que os desenvolvedores criam e como grandes empresas e governos o utilizam quando preferem executar um modelo por conta própria.”
Trechos de um forthcoming livro do repórter do Wall Street Journal, Keach Hagey, publicados no final de semana, alegam que Altman enganou executivos da OpenAI sobre as revisões de segurança do modelo antes de sua breve saída em novembro de 2023.
Conteúdo relacionado
Meta lança Llama 4, uma nova geração de modelos de IA de destaque.
[the_ad id="145565"] A Meta lançou uma nova coleção de modelos de IA, Llama 4, em sua família Llama — em um sábado, nada menos. No total, são quatro novos modelos: Llama 4…
Codificação em grande escala: Ferramentas de IA agora enfrentam todo o ciclo de desenvolvimento
[the_ad id="145565"] Inscreva-se nos nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre cobertura de IA líder na indústria. Saiba mais…
A Ascensão dos Pequenos Modelos de Raciocínio: Podem as IAs Compactas Igualar o Raciocínio em Nível GPT?
[the_ad id="145565"] Nos últimos anos, o campo da IA tem sido cativado pelo sucesso dos grandes modelos de linguagem (LLMs). Inicialmente projetados para processamento de…