Bolt42

A OpenAI anunciou que pretende lançar seu primeiro modelo de linguagem “aberto” desde o GPT‑2 “nos próximos meses”.

Essa informação vem de um formulário de feedback publicado pela empresa em seu site na segunda-feira. O formulário, que a OpenAI está convidando “desenvolvedores, pesquisadores e [membros da] comunidade mais ampla” a preencher, inclui perguntas como “O que você gostaria de ver em um modelo com pesos abertos da OpenAI?” e “Quais modelos abertos você utilizou no passado?”

“Estamos empolgados para colaborar com desenvolvedores, pesquisadores e a comunidade mais ampla para coletar contribuições e tornar este modelo o mais útil possível”, escreveu a OpenAI em seu site. “Se você tem interesse em participar de uma sessão de feedback com a equipe da OpenAI, por favor nos informe [no formulário] abaixo.”

A OpenAI planeja realizar eventos para desenvolvedores a fim de coletar feedback e, no futuro, apresentar protótipos do modelo. O primeiro evento para desenvolvedores ocorrerá em São Francisco nas próximas semanas, seguido por sessões nas regiões da Europa e Ásia-Pacífico.

A OpenAI está enfrentando uma pressão crescente de rivais como o laboratório de IA chinês DeepSeek, que adotaram uma abordagem “aberta” para o lançamento de modelos. Em contraste com a estratégia da OpenAI, esses concorrentes “abertos” disponibilizam seus modelos para a comunidade de IA experimentar e, em alguns casos, comercializar.

Essa estratégia tem se mostrado extremamente bem-sucedida para algumas organizações. A Meta, que investiu pesadamente na sua família de modelos de IA Llama, afirmou no início de março que a Llama já havia registrado mais de 1 bilhão de downloads. Enquanto isso, a DeepSeek rapidamente acumulou uma grande base de usuários em todo o mundo e atraiu a atenção de investidores locais.

Em uma recente sessão de perguntas e respostas no Reddit, o CEO da OpenAI, Sam Altman, disse que acredita que a OpenAI esteve do lado errado da história quando se trata de abrir suas tecnologias.

“[Eu pessoalmente acho que precisamos] descobrir uma estratégia de código aberto diferente,” disse Altman. “Nem todos na OpenAI compartilham essa visão, e também não é nossa prioridade atual […] Vamos produzir modelos melhores [daqui para frente], mas manteremos menos vantagem do que tivemos nos anos anteriores.”

Altman detalhou os planos de modelo aberto da OpenAI em uma publicação no X na tarde de segunda-feira, dizendo que o próximo modelo aberto da OpenAI terá capacidades de “raciocínio” semelhantes às do o3-mini da OpenAI.

“[A]ntes do lançamento, iremos avaliar este modelo de acordo com nossa estrutura de preparação, como faríamos para qualquer outro modelo,” disse Altman. “[E] faremos um trabalho extra sabendo que este modelo será modificado após o lançamento […] [E] estamos animados para ver o que os desenvolvedores criam e como grandes empresas e governos o utilizam quando preferem executar um modelo por conta própria.”

Trechos de um forthcoming livro do repórter do Wall Street Journal, Keach Hagey, publicados no final de semana, alegam que Altman enganou executivos da OpenAI sobre as revisões de segurança do modelo antes de sua breve saída em novembro de 2023.


    treze + cinco =

    Bolt42