Novo Assistente de Voz da OpenAI: GPT-5 em Disfarce?

A OpenAI está lançando seu tão aguardado assistente de voz atualizado para o ChatGPT, e as demonstrações iniciais são absolutamente impressionantes.

A liberação ocorre após um atraso em relação ao lançamento inicialmente planejado para junho, enquanto a OpenAI dedicou tempo para abordar preocupações de segurança e implementar melhorias.

E parece que a espera valeu a pena…

O novo assistente de voz é muito mais rápido, realista e capaz do que as funcionalidades de voz atualmente integradas no ChatGPT.

Na verdade, é tão bom que tem grandes implicações para profissionais de marketing e líderes empresariais.

Eu obtive informações sobre por que esse novo recurso é tão importante com Paul Roetzer, fundador e CEO do Marketing AI Institute, no Episódio 108 do The Artificial Intelligence Show.

É realmente bom (muito, muito bom)

A demonstração inicial desse novo assistente de voz foi impressionante quando a OpenAI a apresentou em maio, diz Roetzer. Agora, as demonstrações do sistema em ação são dignas de atenção, segundo ele.

“Vi pessoas postando vídeos que eu descreveria como chocantes, de quão bom isso é,” afirma Roetzer.

“Ele é capaz de mudar seu tom, inflexão, sotaque, integrar efeitos sonoros à sua voz, transmitir emoção e continuar quando é interrompido. É um pouco estranho, de quão semelhante ao humano ele é.”

É o GPT-5 disfarçado?

Na verdade, é tão bom que Roetzer se pergunta se há mais acontecendo aqui do que apenas um novo recurso para o GPT-4o.

“Quanto mais vejo esses exemplos, mais difícil tenho acreditando que o modelo atual [GPT-4o] que estamos usando no ChatGPT é o que realmente está impulsionando isso,” diz ele. “Parece que tem muito mais capacidade do que qualquer coisa que já interagimos antes.”

Nos últimos seis meses, ele observa que a OpenAI apresentou várias capacidades avançadas além da voz — ou tem rumores sobre estar trabalhando nelas. Estas incluem:

Geração de vídeo com Sora
Geração de imagem aprimorada
Capacidades visuais melhoradas
Raciocínio e solução de problemas aprimorados (o vazado “Project Strawberry”)
Capacidades de busca

“Quanto mais penso sobre isso, mais acho que já estamos vendo [partes do GPT-5],” sugere Roetzer.

Roetzer especula que essas peças individuais, quando combinadas, poderiam formar a base do próximo modelo.

A corrida pela supremacia em IA

Esse desenvolvimento coloca a OpenAI em uma liga própria, ao lado do Google, na busca por IAs mais avançadas.

Roetzer observa que outros players como a Anthropic, apesar de suas forças, não parecem operar no mesmo nível quando se trata de capacidades multimodais como a voz.

“Google e OpenAI estão em um reino todo seu direito agora,” observa Roetzer.

As capacidades avançadas do assistente de voz da OpenAI também levantam questões sobre o futuro dos assistentes de voz existentes, como a Siri da Apple.

Roetzer se pergunta: “Se você adiantar um mês ou dois a partir de agora e todos nós pudermos ter acesso a essa capacidade de voz da OpenAI, por que eu abriria a Siri novamente?”

No entanto, ele especula que a Apple pode se diferenciar posicionando a Siri como um agente de IA local que prioriza a privacidade e uma profunda integração com o ecossistema da Apple.

Isso poderia criar uma distinção entre o assistente de voz mais avançado e de uso geral da OpenAI e a Siri da Apple como um assistente confiável, focado em privacidade, profundamente integrado ao seu dispositivo e aplicativos.

O futuro da interação humano-IA

À medida que essas tecnologias de voz se tornam amplamente disponíveis, estamos provavelmente entrando em uma nova era de interação humano-computador.

“A voz realmente se torna uma interface e isso vai ser incrível,” prevê Roetzer.

Essa mudança pode ter profundas implicações sobre como interagimos com a tecnologia em nossas vidas diárias e em ambientes empresariais. Também pode levantar novas considerações éticas à medida que esses assistentes de IA se tornam mais semelhantes a humanos em suas interações.

“Eu sinto a mesma sensação no estômago que sinto quando alguém [interrompe] outro humano,” admite Roetzer, descrevendo sua reação ao ver pessoas interagindo de forma rude com assistentes de voz de IA.

“Vai ser um problema. É muito bizarro como você começa a atribuir qualidades humanas a essas coisas, mesmo sabendo que elas não estão lá.”

Conteúdo relacionado

Marketing & IA

Novo Assistente de Voz da OpenAI: GPT-5 em Disfarce?

É realmente bom (muito, muito bom)

É o GPT-5 disfarçado?

A corrida pela supremacia em IA

O futuro da interação humano-IA

Conteúdo relacionado

Stagwell Nomeia John Kahan como o Primeiro Diretor de IA

4 Principais Conclusões do Relatório Anual da WPP

A Colapso do SEO Está Prestes a Causar Inflação no CPM?