No final de março, a OpenAI anunciou sua intenção de lançar seu primeiro modelo de linguagem “aberto” desde o GPT-2 em algum momento deste ano. Agora, detalhes sobre esse modelo estão começando a surgir das sessões da empresa com a comunidade de desenvolvedores de IA.
Fontes informam ao TechCrunch que Aidan Clark, VP de pesquisa da OpenAI, está liderando o desenvolvimento do modelo aberto, que está em estágios muito iniciais. A OpenAI está visando um lançamento para o início do verão e pretende fazer do modelo — um modelo de raciocínio nos moldes dos modelos da série o da OpenAI — o melhor entre outros modelos abertos de raciocínio.
A OpenAI está explorando uma licença bastante permissiva para o modelo, com poucas restrições de uso ou comerciais, de acordo com as fontes do TechCrunch. Modelos abertos como o Llama e o Gemma do Google foram criticados por alguns na comunidade por imporem requisitos pesados — críticas que a OpenAI aparentemente está tentando evitar.
A OpenAI está enfrentando pressão crescente de concorrentes, como o laboratório de IA DeepSeek, que adotaram uma abordagem aberta para o lançamento de modelos. Em contraste com a estratégia da OpenAI, esses concorrentes “abertos” disponibilizam seus modelos para a comunidade de IA para experimentação e, em alguns casos, comercialização.
Essa estratégia tem se mostrado extremamente bem-sucedida para algumas empresas. A Meta, que investiu pesadamente em sua família de modelos de IA Llama, disse no início de março que o Llama acumulou mais de 1 bilhão de downloads. Enquanto isso, a DeepSeek rapidamente conquistou uma grande base de usuários mundial e atraiu a atenção de investidores domésticos.
Fontes informam ao TechCrunch que a OpenAI deseja que seu modelo aberto, que terá um funcionamento “texto de entrada, texto de saída”, funcione em hardware consumidor de alta performance e possivelmente permita que os desenvolvedores ativem e desativem seu “raciocínio”, de maneira semelhante aos modelos de raciocínio recentemente lançados pela Anthropic e outros. (O raciocínio pode melhorar a precisão, mas às custas de maior latência.) Se o lançamento for bem recebido, a OpenAI pode lançá-lo em conjunto com modelos adicionais — potencialmente incluindo modelos menores.
Em comentários públicos anteriores, o CEO da OpenAI, Sam Altman, disse que acredita que a OpenAI esteve do lado errado da história quando se trata de abrir o código de suas tecnologias.
“[Eu pessoalmente acho que precisamos] descobrir uma estratégia de código aberto diferente,” disse Altman durante uma sessão de perguntas e respostas no Reddit em janeiro. “Nem todos na OpenAI compartilham essa visão, e também não é nossa prioridade mais alta … Produziremos melhores modelos [daqui para frente], mas manteremos uma liderança menor do que tivemos nos anos anteriores.”
Altman também afirmou que o próximo modelo aberto da OpenAI será cuidadosamente avaliado e testado quanto à segurança. Fontes informam ao TechCrunch que a empresa pretende lançar um cartão de modelo para o modelo — um relatório técnico detalhado mostrando os resultados da avaliação interna e externa de segurança e benchmarking da OpenAI.
“[Antes do lançamento, avaliaremos este modelo de acordo com nossa estrutura de preparação, como faríamos para qualquer outro modelo,” Altman disse em uma postagem no X no mês passado. “[E] faremos um trabalho extra, dado que sabemos que este modelo será modificado após o lançamento.”
A OpenAI tem provocado a ira de alguns éticos de IA por supostamente apressar os testes de segurança de modelos recentes e não ter lançado cartões de modelo para outros. Altman também é acusado de enganar executivos da OpenAI sobre as avaliações de segurança dos modelos antes de sua breve saída em novembro de 2023.
Entramos em contato com a OpenAI para comentários e atualizaremos este artigo se obtivermos uma resposta.
Conteúdo relacionado
Como a Judge-Image da Patronus AI está Moldando o Futuro da Avaliação Multimodal em IA
[the_ad id="145565"] A IA multimodal está transformando o campo da inteligência artificial ao combinar diferentes tipos de dados, como texto, imagens, vídeos e áudio, para…
Grouphug é uma startup em modo furtivo que planeja usar IA em grupos do WhatsApp.
[the_ad id="145565"] Veteranos da cena de startups europeias, que já lançaram diversos aplicativos voltados ao consumidor anteriormente, estão parcialmente saindo do modo…
Alibaba apresenta o Qwen3, uma família de modelos de raciocínio “híbridos” de IA.
[the_ad id="145565"] A empresa chinesa de tecnologia Alibaba anunciou na segunda-feira o lançamento do Qwen3, uma família de modelos de IA que a empresa afirma igualar e, em…