Bolt42

Na semana passada, recebemos muita atenção ao compartilharmos uma citação previamente não relatada de Sam Altman – e todos nós precisamos entender o que essa citação significa, rapidamente.

A citação veio de um livro intitulado Our AI Journey, escrito por Adam Brotman e Andy Sack. Nele, os dois empreendedores entrevistaram Altman para o primeiro capítulo. Quando perguntaram a ele o que a AGI significava para o marketing de marcas de consumo, ele respondeu:

“Oh, para isso? Significará que 95% do que os profissionais de marketing usam agências, estrategistas e criativos hoje será facilmente, quase instantaneamente e a um custo quase nulo, tratado pela IA — e a IA provavelmente poderá testar a criatividade contra grupos focais reais ou sintéticos para prever resultados e otimizar. Novamente, tudo gratuito, instantâneo e quase perfeito. Imagens, vídeos, ideias de campanha? Sem problemas.”

Essa citação fez muitas pessoas em nosso público prestarem atenção. E com razão. Implica um futuro radicalmente disruptivo que está prestes a chegar ao marketing e aos negócios.

O que isso significa para os nossos empregos? Nosso trabalho? Nosso sustento?

Obtive algumas respostas do fundador/CEO do Marketing AI Institute, Paul Roetzer, no Episódio 87 do The Artificial Intelligence Show.

Primeiro, você precisa perceber que isso se aplica a todos

“Essa citação pode induzir um pouco de desespero”, diz Roetzer. “O que devo fazer a seguir?”

Se você se sente assim, não está sozinho. Nós também estamos tentando processar isso.

Para começar, você precisa entender que Altman não está falando apenas sobre marketing. Esse é o exemplo que ele usou na citação.

“Ele está falando sobre trabalho de conhecimento”, diz Roetzer. “Você pode substituir aqui qualquer trabalho de conhecimento – contabilidade, vendas, serviços, operações, RH, engenharia, legal, tudo isso.”

Não importa qual seja o seu trabalho, se ele envolve trabalho de conhecimento, essa citação é pertinente para seu futuro imediato.

Você não pode colocar a cabeça na areia só porque não é um profissional de marketing.

Para Roetzer, a citação o levou a refletir sobre onde estamos hoje com a IA — e para onde estamos indo. Sua análise se baseia em 13 anos de experiência estudando IA. Ele admite prontamente que, como qualquer previsão, pode estar errado. Mas aqui está para onde ele acha que estamos indo…

O que esperar em 2024…

A IA não é nova. Estamos pesquisando a ideia de dar às máquinas inteligência humana há 70 anos.

Por muito tempo, essa pesquisa se concentrou em aprendizado de máquina, um subconjunto fundamental da IA. O aprendizado de máquina fazia previsões sobre resultados e comportamentos. Durante anos, foi aplicado a coisas como otimização de preços e motores de recomendação.

E isso foi valioso para as empresas. Mas não era a IA que temos agora.

“O que temos agora começou a ser realmente comercializado e acelerado em desenvolvimento por volta de 2011 e 2012,” diz Roetzer.

Foi quando o aprendizado profundo, a ideia de dar às máquinas compreensão de visão e linguagem, realmente começou a emergir.

Após uma década de avanços em aprendizado profundo, temos o momento de alarde do ChatGPT no final de 2022.

Avançando para 2024. Já estamos obtendo modelos de linguagem de grande escala (LLMs) mais avançados. Esses modelos estão se tornando multimodais. Isso significa que os modelos podem entender não apenas linguagem, mas imagens, vídeos e áudio. O Gemini do Google, por exemplo, é construído desde o início para ser multimodal.

A próxima fronteira, diz Roetzer, é o raciocínio.

“Esses modelos vão fazer saltos em frente em sua capacidade de raciocínio”, diz ele. Isso significa que eles nos permitirão resolver problemas, planejar e tomar decisões ainda melhor do que fazem hoje.

Ao mesmo tempo, estamos vendo janelas de contexto muito maiores. O Gemini do Google agora tem uma impressionante janela de contexto de 1 milhão de tokens. (E o Google relata que alcançou uma janela de 10 milhões de tokens em sua pesquisa.) Esta é a quantidade de informação que o modelo é capaz de extrair para criar a saída.

Janelas de contexto, de certa forma, levam a uma memória aprimorada, diz Roetzer. Todos os principais players da IA estão trabalhando para dar aos modelos a capacidade de lembrar conversas e interações. (A OpenAI já está testando uma função de memória para o ChatGPT.)

Isso significa que uma ferramenta como o ChatGPT extraíra do contexto de suas interações quando você a usa. Assim, a experiência de cada pessoa será adaptada especificamente a ela.

“Você vai poder definir os parâmetros sobre como deseja interagir com isso, como deseja que ela converse com você, que tom, que estilo, quais crenças políticas, quais crenças religiosas, tudo será personalizado,” diz Roetzer.

Ao mesmo tempo, as empresas estão se concentrando em tornar os modelos mais confiáveis e precisos. Assim, você pode realmente começar a confiar neles.

2024 é o ano em que isso começa a acontecer. Já esperamos o GPT-5 em algum momento deste ano. Ele provavelmente será acompanhado pelo Gemini 2, Llama 3 e outros modelos comparáveis.

“Raciocínio multimodal, planejamento, decisão, janelas de contexto expandidas, memória, personalização, confiabilidade. Isso é o que os modelos da classe GPT-5 vão permitir,” diz Roetzer.

Então, o que isso significa para os negócios a curto prazo?

“Acho que isso significa que começaremos a ver uma escalada na adoção da IA,” diz Roetzer.

Ele espera uma rápida expansão de casos de uso valiosos nos negócios, graças aos modelos da classe GPT-5. Isso não acontecerá da noite para o dia. Mas você verá uma expansão ao longo de vários anos começando em breve.

Ainda não está claro como as empresas responderão. Elas podem construir sobre modelos abertos, modelos fechados ou uma combinação de ambos.

Modelos cada vez mais poderosos não apenas afetarão os negócios nos próximos 1-2 anos, diz Roetzer.

“Avanços científicos estão a caminho.” Demis Hassabis, do Google DeepMind, acredita que veremos grandes avanços nos próximos 1-2 anos.

Isso porque os modelos de IA podem processar muitos dados que já temos e que não conseguimos analisar e usar em escala. Portanto, Roetzer espera avanços a partir de dados existentes no futuro próximo.

Finalmente, em 2024, Roetzer espera que comecemos a discutir o impacto da IA nos empregos. Mas não da maneira que você pode pensar.

“Haverá histórias de demissões em massa este ano dentro de algumas indústrias, mas não acho que será generalizado. Mas você verá algumas manchetes,” diz ele.

Ele é cético de que este seja o ano em que veremos um grande impacto nos empregos. Embora alguns novos cargos, como Chefe de IA, comecem a surgir.

Na verdade, você poderia considerar isso como a calma antes da tempestade.

Você verá todos os modelos ficarem mais inteligentes. Você verá todos os modelos melhorarem em raciocínio, planejamento, memória e personalização.

Mas é improvável que você veja um único ponto de inflexão onde, de repente, tudo é diferente, diz Roetzer.

Ainda não.

O que pode estar a caminho em 2025 e 2026…

Roetzer vê 2025 e 2026 como os anos da explosão da IA multimodal.

Os modelos se tornarão muito mais capazes em 2024. Mas agora é quando realmente os capacitaremos com todos os diferentes tipos de dados. Por exemplo, no último ano, o ChatGPT aprendeu a processar imagens. Ele não pode, até o momento da redação, processar vídeo. Isso está a caminho. O modelo de vídeo Sora da OpenAI é um prelúdio para isso.

Levará algum tempo para ensinar cada um dos principais modelos a utilizar todos os tipos diferentes de meios.

“Acho que ainda estamos a 1-2 anos de onde a multimodalidade será simplesmente ubíqua,” diz Roetzer.

Quando isso acontecer, modelos verdadeiramente multimodais funcionarão simplesmente quando você conversar e interagir com eles por meio de vídeos, imagens e texto.

Nesta fase, dados sintéticos se tornam extremamente importantes.

Os modelos aprendem a partir da apresentação de dados. (O ChatGPT foi treinado na internet pública.) Para torná-los mais capazes, precisamos alimentá-los com mais dados, mais rápido. Alguns destes modelos estão começando a aprender pela observação. Ferramentas como o Sora permitirão a criação de dados visuais sintéticos, diz Roetzer. Isso pode então ser usado para treinar rapidamente modelos de IA em tarefas de visão.

“Acho que dados sintéticos potencialmente se tornarão a principal fonte de treinamento para visão,” diz ele.

Isso, por sua vez, leva a uma explosão ainda maior de melhorias nas capacidades.

E isso, por sua vez, é quando começamos a sentir seu verdadeiro poder.

“Basicamente, essas coisas se tornam infinitamente mais valiosas em um ambiente de negócios e realmente começam a mudar a maneira como trabalhamos.”

A chegada dos agentes de IA…

Roetzer estima que entre 2025 e 2027 começaremos a ver uma explosão de agentes de IA. Agentes de IA são sistemas de IA que podem realizar ações por você.

Já temos exemplos iniciais deles hoje. “Mas eu acho que este ano ainda são apenas manchetes, experimentações e demonstrações,” diz Roetzer.

Ele estima que os agentes de IA estão atualmente na fase “GPT 1”. Eles ainda exigem muito trabalho manual para funcionar adequadamente. E quando funcionam, muita supervisão é necessária.

Mas, eventualmente, chegaremos a um ponto em que eles poderão agir por você de forma confiável com pouca ou nenhuma supervisão.

Agora, é aqui que começamos a entrar na disrupção que Altman menciona em sua citação…

“A disrupção do trabalho de conhecimento começará a se tornar mais tangível em 2025 ou 2026 como resultado disso,” diz Roetzer.

Provavelmente teremos a capacidade de ajustar e treinar agentes para fazer todas as coisas que fazemos no trabalho. E também provavelmente teremos agentes de IA geralmente capazes que não precisarão ser treinados de forma alguma. Eles simplesmente observarão o que você faz, aprenderão e irão fazer isso.

Prevendo 2026 a 2030 e além…

A partir daqui, diz Roetzer, fica muito difícil projetar.

Mas após os agentes de IA, podemos esperar a explosão da robótica, possivelmente começando entre 2026 e 2030.

Já estamos vendo grandes avanços em robótica. Um exemplo: a OpenAI se associou à Figure, uma startup de robótica líder que acaba de levantar capital significativo. Eles estão trabalhando para colocar os modelos multimodais que acabamos de discutir em robôs reais.

“O verdadeiro avanço é colocar os modelos multimodais em robôs para incorporar inteligência. Portanto, o avanço com esses grandes modelos de linguagem e esses agentes de IA permitirá uma decolagem rápida da robótica,” diz Roetzer.

É aqui que as coisas realmente começam a ficar estranhas.

Vamos nos concentrar, e veremos, muito impacto no trabalho de conhecimento ao longo dos próximos anos. Mas assim que os robôs tiverem seu momento de ChatGPT, agora todo o trabalho começará a ser afetado.

“Acho que é quando começará a ficar mais claro o impacto que a IA terá sobre os empregos de colarinho azul.”

Simultaneamente, os modelos dentro da robótica não pararam de progredir.

Ao longo de todo esse tempo, estamos nos dirigindo para o fim do jogo que pessoas como Altman acreditam que está chegando:

AGI, ou inteligência geral artificial. Esta é uma IA que é amplamente muito mais capaz do que os humanos em muitas coisas diferentes.

Mesmo os principais especialistas discordam quando isso vai acontecer — ou mesmo se é possível. Pode acontecer lentamente em estágios, em vez de tudo de uma vez, diz Roetzer.

Mas se acontecer, muda tudo.

“Uma vez que cheguemos à AGI, tudo é redefinido,” diz ele. “Uma vez que chegamos aqui, agora estamos olhando para a realidade da disrupção em larga escala da força de trabalho. Você está redefinindo completamente os negócios.”

Em sua citação do Our AI Journey, Altman disse que acredita que a AGI será uma realidade em “5 anos, mais ou menos, talvez um pouco mais.”

Essa é apenas uma opinião, é claro. Mas é de alguém que está ativamente construindo e guiando o futuro da IA.

Roetzer admite totalmente que suas projeções podem estar erradas. Ou que a AGI pode não emergir da maneira que pessoas como Altman preveem.

Mas o que você deve prestar atenção é na direção para onde tudo isso está indo:

Mesmo que a AGI não surja, poderíamos ter acesso a modelos multimodais e agentes que são 1000X mais capazes do que temos hoje, diz Roetzer.

Só isso já vai mudar tudo. E é hora de começar a se preparar para essas mudanças.




Bolt42