Para encerrar um dia de lançamentos de produtos, pesquisadores, engenheiros e executivos da OpenAI, incluindo o CEO da OpenAI, Sam Altman, responderam a perguntas em uma ampla AMA no Reddit na sexta-feira.
A empresa OpenAI se encontra em uma posição um tanto precária. Está lutando contra a percepção de que está perdendo terreno na corrida da IA para empresas chinesas como a DeepSeek, da qual a OpenAI alega que pode ter roubado sua propriedade intelectual. O criador do ChatGPT tem tentado fortalecer seu relacionamento com Washington e, ao mesmo tempo, buscar um ambicioso projeto de data center, enquanto supostamente prepara um dos maiores ciclos de financiamento da história.
Altman admitiu que a DeepSeek diminuiu a vantagem da OpenAI na IA e também afirmou que acredita que a OpenAI esteve “do lado errado da história” no que diz respeito ao open sourcing de suas tecnologias. Embora a OpenAI tenha open-sourced modelos no passado, a empresa, em geral, tem favorecido uma abordagem de desenvolvimento proprietária e de código fechado.
“[Eu pessoalmente acho que precisamos] descobrir uma estratégia de código aberto diferente,” disse Altman. “Nem todos na OpenAI compartilham essa visão, e também não é nossa prioridade atual […] Vamos produzir modelos melhores [daqui em diante], mas manteremos uma vantagem menor do que tivemos em anos anteriores.”
Em uma resposta seguinte, Kevin Weil, diretor de produtos da OpenAI, disse que a OpenAI está considerando open-source modelos mais antigos que não são mais de ponta. “Definitivamente pensaremos em fazer mais disso,” disse ele, sem entrar em mais detalhes.
Além de levar a OpenAI a reconsiderar sua filosofia de liberação, Altman disse que a DeepSeek empurrou a empresa a revelar potencialmente mais sobre como seus chamados modelos de raciocínio, como o modelo o3-mini lançado hoje, mostram seu “processo de pensamento.” Atualmente, os modelos da OpenAI ocultam seu raciocínio, uma estratégia destinada a impedir que concorrentes extraírem dados de treinamento para seus próprios modelos. Em contraste, o modelo de raciocínio da DeepSeek, R1, mostra toda a sua cadeia de pensamento.
“Estamos trabalhando para mostrar muito mais do que mostramos hoje — [mostrar o processo de pensamento do modelo] será muito, muito em breve,” acrescentou Weil. “TBD em tudo — mostrar toda a cadeia de pensamento leva à destilação competitiva, mas também sabemos que as pessoas (pelo menos os usuários avançados) querem isso, então encontraremos a maneira certa de equilibrar.”
Altman e Weil tentaram dissipar rumores de que o ChatGPT, o aplicativo de chatbot por meio do qual a OpenAI lança muitos de seus modelos, aumentaria de preço. Altman disse que gostaria de tornar o ChatGPT “mais barato” ao longo do tempo, se viável.
Altman já disse anteriormente que a OpenAI estava perdendo dinheiro em seu plano mais caro do ChatGPT, o ChatGPT Pro, que custa $200 por mês.
Em um tópico um tanto relacionado, Weil disse que a OpenAI continua a ver evidências de que mais poder de computação leva a modelos “melhores” e mais performáticos. Isso é em grande parte o que está tornando necessários projetos como o Stargate, o recém-anunciado projeto de data center massivo da OpenAI, disse Weil. Atender a uma base de usuários crescente está aumentando a demanda por computação dentro da OpenAI, continuou ele.
Questionado sobre a auto-melhora recursiva que poderia ser habilitada por esses modelos poderosos, Altman disse que acredita que um “crescimento acelerado” é mais plausível do que ele uma vez acreditou. A auto-melhora recursiva é um processo onde um sistema de IA pode melhorar sua própria inteligência e capacidades sem a intervenção humana.
É claro que vale a pena notar que Altman é notório por fazer promessas excessivas. Não faz muito tempo que ele abaixou a barra da OpenAI para AGI.
Um usuário do Reddit perguntou se os modelos da OpenAI, seja auto-melhorando ou não, seriam usados para desenvolver armas destrutivas — especificamente armas nucleares. Esta semana, a OpenAI anunciou uma parceria com o governo dos EUA para fornecer seus modelos aos Laboratórios Nacionais dos EUA, em parte para pesquisa de defesa nuclear.
Weil disse que confia no governo dos EUA.
“Eu conheci esses cientistas e eles são especialistas em IA além de serem pesquisadores de classe mundial,” disse ele. “Eles entendem o poder e os limites dos modelos, e eu não acho que haja qualquer chance de apenas despejarem algum resultado do modelo em um cálculo nuclear. Eles são inteligentes e baseados em evidências e fazem muita experimentação e trabalho de dados para validar todo o seu trabalho.”
A equipe da OpenAI foi questionada sobre várias questões de natureza mais técnica, como quando o próximo modelo de raciocínio da OpenAI, o o3, será lançado (“mais de algumas semanas, menos de alguns meses,” disse Altman), quando o próximo modelo “não-raciocínio” de destaque da empresa, o GPT-5, poderá chegar (“não temos um cronograma ainda,” disse Altman), e quando a OpenAI poderá revelar um sucessor ao DALL-E 3, o modelo de geração de imagens da empresa. O DALL-E 3, que foi lançado há cerca de dois anos, ficou um pouco ultrapassado. A tecnologia de geração de imagens melhorou imensamente desde o lançamento do DALL-E 3, e o modelo é não mais competitivo em várias avaliações de referência.
“Sim! Estamos trabalhando nisso,” disse Weil sobre um sucessor do DALL-E 3. “E eu acho que vai valer a pena a espera.”
Conteúdo relacionado
A Convicção da Guo Partners adiciona Mike Vernal como GP e arrecada fundo de 230 milhões de dólares
[the_ad id="145565"] Quando, em meados de 2022, Sarah Guo deixou a Greylock para lançar seu próprio fundo focado em IA, Conviction Partners, ela indicou que estava adicionando…
Sam Altman admite que a OpenAI estava ‘do lado errado da história’ no debate sobre código aberto.
[the_ad id="145565"] Participe de nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre cobertura de IA líder da indústria. Saiba mais…
Centenas de empresas estão bloqueando o DeepSeek devido aos riscos de dados na China
[the_ad id="145565"] A DeepSeek fez sucesso nos EUA esta semana: o chatbot da empresa chinesa alcançou o topo das lojas Apple e Play, enquanto grandes provedores de nuvem dos…