Bolt42

Nota do Editor: Este post foi originalmente publicado antes do Dia 4 dos 12 Dias de OpenAI. Ele será atualizado ao longo do evento com novos lançamentos e anúncios.

A OpenAI lançou uma ambiciosa campanha de fim de ano chamada “12 Dias de OpenAI” que apresenta lançamentos de produtos e recursos a cada dia útil entre 5 e 20 de dezembro. E após três dias, já estamos vendo algumas das atualizações mais significativas na história da empresa.

Até agora, vimos a OpenAI lançar seu completo modelo o1 de raciocínio, estrear uma licença ChatGPT Pro de $200 por mês, lançar o reforço de ajuste fino e (finalmente!) liberar totalmente seu modelo de geração de vídeo de ponta, Sora.

O que você precisa saber sobre os lançamentos?

Eu resumi tudo isso com Paul Roetzer, fundador e CEO do Marketing AI Institute, no Episódio 126 do The Artificial Intelligence Show.

Dia 1: O Modelo o1 Completo e ChatGPT Pro

No Dia 1, que ocorreu na quinta-feira, 5 de dezembro, a OpenAI anunciou o lançamento completo de seu modelo de raciocínio o1 e uma nova camada de assinatura premium chamada ChatGPT Pro.

O modelo o1 é único porque, ao contrário de outros modelos, leva tempo para pensar em problemas usando raciocínio em cadeia. Isso permite que o o1 resolva problemas muito mais difíceis e raciocine em tarefas mais complexas do que modelos de raciocínio geral, como o GPT-4o.

Isso desbloqueia uma série de novos casos de uso para a IA.

“É predominantemente para problemas mais difíceis, como matemática, biologia, engenharia e questões relacionadas à ciência”, diz Roetzer.

Anteriormente, os usuários tinham acesso ao o1-preview, uma versão de pré-visualização deste modelo completo. Agora, temos a versão real. E ela é muito mais poderosa — e precisa — que sua antecessora. A OpenAI afirma que a nova versão comete 34% menos erros graves, processando informações 50% mais rápido.

Este modelo também é multimodal, o que significa que pode processar texto e imagens juntos. Ele também foi aprimorado com base no feedback dos usuários da versão de pré-visualização.

Os usuários do ChatGPT Plus têm acesso ao o1 agora. Os usuários do ChatGPT Pro também têm.

Nunca ouviu falar do ChatGPT Pro? Isso porque é uma camada de assinatura completamente nova que também foi anunciada no Dia 1.

O ChatGPT é uma camada premium projetada para usuários avançados do ChatGPT. Custa $200 por mês e oferece acesso ilimitado ao novo modelo o1, além do modelo o1-mini menor e mais rápido, GPT-4o, e Modo de Voz Avançado.

Dia 2: Reforço de Ajuste Fino

No Dia 2, a OpenAI anunciou a expansão do que chama de “Programa de Pesquisa de Reforço de Ajuste Fino”, que permite a desenvolvedores e engenheiros de machine learning criar modelos especializados ajustados para se destacarem em conjuntos específicos de tarefas complexas e de domínio específico.

“Este é um anúncio para desenvolvedores,” diz Roetzer. O usuário médio de negócios provavelmente não desenvolverá essa funcionalidade por conta própria, mas sim se unirá a um desenvolvedor ou equipe de TI interna.

Não há nada de errado nisso. Na verdade, é uma oportunidade valiosa se você tiver recursos de desenvolvimento disponíveis e um forte caso de uso para um modelo específico de domínio.

Isso também sugere um futuro onde cada empresa, cada empreendimento e talvez cada indivíduo (independentemente de suas habilidades técnicas) possa treinar modelos personalizados.

Eventualmente, poderemos até treinar modelos ajustados para qualquer domínio (ou mesmo para departamentos individuais em empresas) da mesma forma que construímos GPTs personalizados, diz ele.

Dia 3: Sora

No Dia 3, a OpenAI finalmente lançou Sora, seu modelo de geração de vídeo de ponta. Sora foi inicialmente apresentado no início de 2024, mas seu lançamento foi adiado à medida que a OpenAI enfrentou obstáculos no desenvolvimento.

Agora, a empresa desenvolveu uma nova versão mais rápida do Sora chamada Sora Turbo — e usuários do ChatGPT Plus e Pro podem acessá-la em www.sora.com.

O novo Sora permite gerar vídeos de 5 a 20 segundos com base em um prompt de texto ou simplesmente enviando uma imagem.

Os vídeos podem ser gerados em proporções de tela ampla, vertical ou quadrada. E eles podem ter resolução de até 1080p.

O Sora também inclui uma ferramenta de storyboard que permite controlar com precisão seus vídeos quadro a quadro. E, você pode usar seus próprios ativos para estender, remixar ou combinar conteúdo.

O acesso ao Sora é escalonado. Usuários do ChatGPT Plus podem gerar até 50 vídeos mensalmente com resolução de 480p (ou menos com 720p) sem custo adicional, enquanto assinantes Pro têm 10 vezes mais uso, resoluções mais altas e durações mais longas.

O serviço está atualmente disponível na maioria das regiões onde o ChatGPT opera, embora notavelmente não no Reino Unido, Suíça ou na Área Econômica Europeia.

Enquanto testamos o Sora, diz Roetzer, qualidade e velocidade serão fatores importantes a serem avaliados.

A geração de vídeo por IA, embora impressionante hoje, ainda sofre com muitos problemas de consistência na qualidade do vídeo e nas saídas.

“Com a geração de vídeo, é realmente difícil manter a consistência de personagens e quadros,” diz ele.

As ferramentas atuais também podem levar muito tempo para gerar um único vídeo. Em muitos casos, você pode esperar minutos por um único vídeo de alguns segundos e, em seguida, perceber que precisa regenerar o vídeo várias vezes para chegar mais perto do que realmente deseja.

Se o Sora resolve esses problemas ainda é uma incógnita. Mas, Roetzer observa, pode não precisar ser perfeito para ter um grande impacto. Em muitos filmes e vídeos, a cena média dura apenas alguns segundos. Se o Sora conseguir gerar alguns segundos de vídeo com qualidade extremamente alta em um período relativamente curto, isso pode alterar a forma como o trabalho em vídeo e cinema é realizado.

“E se ele for realmente bom em cinco segundos?” pergunta Roetzer. “Isso é suficiente porque você pode simplesmente juntar quadro a quadro — e de repente começar a construir coisas incríveis. Portanto, espero que a adoção disso seja massiva se funcionar realmente bem.”

 



Bolt42