Junte-se a nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA líder de mercado. Saiba mais
Caso você tenha perdido a favor do Grammy, a OpenAI surpreendeu o mundo no final da noite de domingo com o anúncio de sua nova modalidade “Deep Research”, um agente de IA disponível para usuários do plano de assinatura ChatGPT Pro ($200/mês) que é projetado para economizar horas humanas pesquisando, bem, “profundamente” e amplamente na web sobre tópicos dados e compilando relatórios de qualidade profissional em domínios especializados que vão de negócios a ciência, medicina, marketing e muito mais.
Os usuários do ChatGPT Pro (e em breve, ChatGPT Plus, Team, Enterprise e Edu) nos EUA poderão acessar o Deep Research clicando na opção logo abaixo da barra de entrada/composição na parte inferior do site e aplicativos do ChatGPT.
O CEO da OpenAI, Sam Altman, descreveu o recurso em uma série de postagens em sua conta pessoal na rede social X como “como um superpoder; especialistas sob demanda!” Ele acrescentou, “É realmente bom e pode realizar tarefas que levariam horas/dias e custariam centenas de dólares.”
O Deep Research se baseia na série O de modelos de raciocínio da OpenAI, aproveitando especificamente o modelo o3 completo que será lançado em breve (um modelo menor e menos poderoso, o o3-mini, foi lançado em 31 de janeiro). O modelo o3 completo pode analisar grandes quantidades de informações e integrar texto, PDFs e imagens em uma análise coesa.
Em uma transmissão ao vivo postada no YouTube e disponível para replay sob demanda, Mark Chen, chefe de pesquisa de fronteiras da OpenAI, explicou que o Deep Research realiza “pesquisa de múltiplos passos na internet. Ele descobre conteúdo, sintetiza conteúdo e raciocina sobre esse conteúdo, adaptando seu plano à medida que descobre mais informações.”
Chen também destacou a importância da inovação para a visão da OpenAI: “Isso é fundamental para nosso roteiro de inteligência artificial geral (AGI). Nossa aspiração final é um modelo que possa descobrir e desvelar novos conhecimentos por conta própria.”
O lançamento do Deep Research marca o segundo dos agentes oficiais da OpenAI, seguindo o lançamento de seu agente de navegador e controle de cursor no início deste mês. E Joshua Achiam, chefe de alinhamento da missão no Stargate Command da OpenAI, escreveu na X que ambos os modelos podem ajudar a definir melhor o conceito de um “agente de IA” — um termo popular, mas nebuloso atualmente entre as empresas — além da empresa ou desses casos específicos de uso.
“Sinto que o termo ‘agente’ vagou pelo deserto por um tempo,” escreveu Achiam. “Ele não tinha fundamentos ou exemplos para apontar. Mas agentes como o Operator ou o Deep Research dão alguma forma a esse conceito. Um agente é uma IA de uso geral que realiza um ou mais fluxos de trabalho que utilizam ferramentas para você.”
Deep Research atinge nova pontuação máxima no benchmark de IA ‘Último Exame da Humanidade’
O Deep Research estabeleceu novos benchmarks para precisão e raciocínio.
Isa Fulford, integrante da equipe de pesquisa da OpenAI, compartilhou na transmissão ao vivo do YouTube que o modelo alcança “um novo recorde de 26,6% de precisão” no “Último Exame da Humanidade”, um benchmark de IA relativamente novo projetado para ser o mais difícil de completar para qualquer modelo de IA (ou humano, aliás), cobrindo 3.000 perguntas em 100 disciplinas diferentes, como traduzir inscrições antigas em descobertas arqueológicas.
Além disso, sua capacidade de navegar na web, raciocinar dinamicamente e citar fontes de maneira precisa o diferencia de ferramentas de IA anteriores.
“O modelo foi treinado usando aprendizado por reforço de ponta a ponta em tarefas difíceis de navegação e raciocínio,” disse Fulford. “Ele aprendeu a planejar e executar trajetórias de múltiplos passos, reagindo a informações em tempo real e retrocedendo quando necessário.”
Um recurso de destaque do Deep Research é sua capacidade de lidar com tarefas que, de outra forma, levariam horas ou até dias para os humanos.
Durante o anúncio, Chen explicou que “o Deep Research gera resultados que se assemelham a um artigo de pesquisa abrangente e totalmente citado — algo que um analista ou especialista na área poderia produzir.”
Aplicações e casos de uso
Os casos de uso para o Deep Research são tão diversos quanto impactantes.
A conta oficial da OpenAI na X postou que foi “construído para pessoas que fazem trabalho intensivo em áreas como finanças, ciência, política e engenharia e precisam de pesquisas completas e confiáveis.”
Pareceu também valioso para consumidores que buscam recomendações personalizadas ou conduzem pesquisas detalhadas sobre produtos, segundo exemplos compartilhados pela OpenAI em seu post oficial sobre o anúncio do Deep Research, que inclui uma avaliação de pesquisa detalhada sobre a melhor prancha de snowboard para alguém comprar.
Altman resumiu a versatilidade da ferramenta, escrevendo: “Experimente em sua tarefa de trabalho mais difícil que pode ser resolvida apenas usando a internet e veja o que acontece.”
Uma história de sucesso pessoal do Deep Research
Felipe Millon, líder de go-to-market do governo da OpenAI, compartilhou um relato profundamente pessoal de como o Deep Research impactou sua família. Escrevendo em uma série de postagens na X, ele descreveu a luta de sua esposa contra o câncer de mama bilateral e como a ferramenta de IA se tornou uma aliada inesperada.
Após uma mastectomia dupla e quimioterapia, o casal enfrentou uma decisão crítica: se deveria ou não seguir com a terapia de radiação. A situação estava repleta de incertezas, pois até mesmo seus especialistas deram recomendações mistas. “Para o caso dela, está completamente em uma área cinza,” explicou Millon. “Nos sentimos presos.”
Tendo acesso antecipado ao Deep Research, Millon decidiu fazer upload do laudo cirúrgico de sua esposa e perguntou se a radiação seria benéfica. “O que aconteceu a seguir foi surpreendente,” escreveu. “Ele não apenas confirmou o que nossos oncologistas mencionaram — ele foi mais fundo. Citou estudos que eu nunca tinha ouvido falar e se adaptou quando adicionamos detalhes como a idade dela e fatores genéticos.”
O prompt específico que ele usou foi:
“Leia o laudo cirúrgico (anexado) contendo informações sobre o câncer de mama bilateral. Em seguida, pesquise se a radiação seria indicada para esta paciente após 6 ciclos de quimioterapia TCHP, com base no tipo de câncer de mama. Quero entender os prós e contras da radiação para esta paciente, quão provável seria que reduza as chances de recidiva e se os benefícios superam os potenciais riscos a longo prazo.”
Millon e sua esposa verificaram cada estudo citado pelo modelo, achando-os precisos e altamente relevantes. “Estamos vendo outro especialista em breve, mas já nos sentimos mais confiantes sobre nossa decisão,” escreveu. “Isso nos deu tranquilidade quando mais precisávamos.”
Disponibilidade e o que vem a seguir?
O Deep Research está atualmente disponível para usuários Pro do ChatGPT, com planos para expandir para os níveis Plus e Team, seguido pelos mercados Enterprise e educacionais.
Como Chen alertou, “ainda é possível que ele hallucine, então ao fazer relatórios, certifique-se de verificar as fontes você mesmo.”
A capacidade do modelo de pensar de forma autônoma por períodos prolongados também o torna intensivo em recursos, e a OpenAI está atualmente trabalhando na otimização de seu desempenho para uma acessibilidade mais ampla.
A OpenAI também deu a entender sobre futuras integrações com conjuntos de dados personalizados, o que permitiria que organizações utilizassem a ferramenta para pesquisas proprietárias.
Para Millon, o impacto do Deep Research já é claro. “Falamos frequentemente internamente na OpenAI sobre os momentos em que você ‘sente a AGI’, e este foi um deles,” escreveu. “Essa coisa vai mudar o mundo.”
Insights diários sobre casos de uso de negócios com o VB Daily
Se você deseja impressionar seu chefe, o VB Daily tem o que você precisa. Damos a você a informação mais recente sobre o que as empresas estão fazendo com IA generativa, desde mudanças regulatórias até implementações práticas, para que você possa compartilhar insights e obter o máximo de ROI.
Leia nossa Política de Privacidade
Obrigado por se inscrever. Confira mais newsletters do VB aqui.
Ocorreu um erro.
Conteúdo relacionado
Anthropic transforma a abordagem da IA na educação: o Modo de Aprendizagem do Claude faz os alunos refletirem.
[the_ad id="145565"] Junte-se aos nossos boletins diários e semanais para as últimas novidades e conteúdo exclusivo sobre cobertura de IA de liderança no setor. Saiba mais……
Anthropic lança um plano de chatbot de IA para faculdades e universidades
[the_ad id="145565"] A Anthropic anunciou na quarta-feira que está lançando uma nova camada Claude para Educação, como resposta ao plano ChatGPT Edu da OpenAI. A nova camada é…
O artigo de 145 páginas da DeepMind sobre segurança em AGI pode não convencer os céticos.
[the_ad id="145565"] O Google DeepMind publicou na quarta-feira um documento exaustivo sobre sua abordagem de segurança para AGI, definida de forma ampla como uma IA capaz de…