Bolt42

Esta semana, trazemos uma abundância de notícias sobre IA em dois episódios especiais. Junte-se a nós no Episódio 93 enquanto os anfitriões Paul Roetzer e Mike Kaput exploram os poderosos modelos de código aberto da Meta e a integração do assistente de IA, o impressionante gerador de vídeo VASA-1 da Microsoft e o conceito intrigante de “Serviço como Software”. Fique ligado para ainda mais esta semana!

Ouça ou assista abaixo—e veja abaixo para as notas do programa e a transcrição.

O episódio de hoje é patrocinado pela rasa.io.

A rasa.io é a plataforma definitiva para newsletters impulsionadas por IA. Se você está procurando transformar sua newsletter de e-mail em uma ferramenta poderosa e envolvente que realmente ressoe com seu público, a rasa.io é a mudança de jogo que você precisa. Junte-se às mais de 500 organizações que já estão tornando suas newsletters inteligentes.
Visite rasa.io/maii hoje.

Marcos de Tempo

  • 00:05:25 — Llama 3
  • 00:31:18 — VASA-1 da Microsoft
  • 00:37:29 — A Mudança de Paradigma da IA como Serviço
  • 00:47:56 — Adobe Adicionando Sora, Runway, Pika ao Premiere Pro
  • 00:53:26 — Robô Atlas da Boston Dynamics + A Revolução da Robótica
  • 00:56:24 — UGC da IA da HeyGen
  • 00:58:19 — Entrevista com Sam Altman no 20VC
  • 01:00:55 — Drake Lança Faixa com Vozes de IA de Snoop Dogg e Tupac
  • 01:02:59 — IA para Entrevistas de Candidatos a Emprego
  • 01:06:55 — Fadiga de IA

Resumo

Meta Anuncia Llama 3

A Meta fez grandes movimentações de IA esta semana. A empresa anunciou o lançamento do Llama 3, a próxima versão de seus poderosos modelos de IA de código aberto. A Meta afirma que o Llama 3 supera outros modelos de código aberto, como o Gemma do Google e o Mistral. Também parece superar o Gemini Pro 1.5 e o Claude 3 Sonnet em pelo menos alguns benchmarks importantes.

Atualmente, há dois modelos de Llama 3 de código aberto que os desenvolvedores podem usar livremente, um modelo de 8B parâmetros e um de 70B parâmetros. Também há uma versão de 405B parâmetros do Llama 3 que está a caminho e ainda está em treinamento. (Embora não esteja claro no momento se essa versão de 405B será de código aberto). A Meta disse ao The Verge que o conjunto de dados de treinamento do Llama 3 é 7 vezes maior que o do Llama 2, mas não usou nenhum dado de usuários da Meta. Notavelmente, inclui uma mistura de dados da “internet pública” e dados gerados pela IA sintética.

Outra novidade empolgante é que o Llama 3 dará suporte ao assistente AI da Meta que agora está sendo integrado no Instagram, Facebook, WhatsApp e Messenger. A Meta AI está disponível há algum tempo, mas o Llama 3 fornecerá uma atualização significativa em suas capacidades — e você pode agora acessar essas capacidades em um assistente AI independente se você visitar Meta.ai.

A Meta AI fornece resultados semelhantes ao ChatGPT e também permite que você gere imagens. É digno de nota que a Meta AI pode realmente pesquisar na web enquanto você interage com o assistente IA.

VASA-1 da Microsoft

A Microsoft acaba de lançar uma pesquisa sobre um modelo de IA que pode deepfake alguém a partir de uma única foto. O modelo é chamado VASA-1 e pode usar uma foto para criar um vídeo realista de uma pessoa falando ou cantando, que se sincroniza com uma faixa de áudio existente. A Ars Technica relatou:

“A estrutura VASA (abreviação de ‘Visual Affective Skills Animator’) usa aprendizado de máquina para analisar uma imagem estática junto com um clipe de áudio de fala. Em seguida, consegue gerar um vídeo realista com expressões faciais precisas, movimentos da cabeça e sincronia labial com o áudio.”

No momento, ele não clona ou simula vozes. Curiosamente, o modelo foi treinado com clipes do YouTube. Utilizou um conjunto de dados criado há anos por pesquisadores que contém dados extraídos de vídeos carregados no YouTube.

Dada a aparente velocidade e potência do modelo, ele pode ser usado em aplicações em tempo real, como videoconferência — ou alimentar avatares que renderizam localmente. Pesquisadores da Microsoft, cautelosos sobre as maneiras como essa tecnologia poderia ser mal utilizada, não estão liberando abertamente o código que alimenta o modelo.

A Mudança de Paradigma da IA como Serviço

Uma possível mudança de paradigma impulsionada por IA no SaaS está recebendo muita atenção online. O conceito é chamado de “serviço como software” e está delineado em um ensaio da Foundation Capital, uma empresa de capital de risco que investiu em nomes notáveis como Netflix e firmas de IA como Jasper.

A Foundation Capital define a mudança de paradigma “serviço como software” da seguinte maneira: a IA está provocando uma transição de Software como Serviço para Serviço como Software. O que significa isto? No passado, você comprava acesso a uma ferramenta de software ou plataforma, que você então usava para alcançar os resultados desejados em seu trabalho.

No entanto, a IA está mudando isso, não apenas oferecendo acesso a ferramentas, mas acesso a bots que essencialmente atuam como cérebros. Em outras palavras, ao comprar uma ferramenta de IA, você está comprando acesso a um bot que pode, cada vez mais, realizar um serviço para você, em vez de lhe dar a possibilidade de realizar esse serviço de forma mais eficaz.

Um exemplo: em vez de comprar o QuickBooks para capacitar seus profissionais de finanças ou uma empresa externa para manter suas contas, você pode simplesmente estar comprando acesso a um contador de IA que executa o trabalho do profissional financeiro ou da empresa externa inteiramente.

Essa é uma mudança que tem enormes implicações tanto para empregos quanto para empresas de SaaS, segundo a Foundation Capital. Eles observam: “O tamanho da oportunidade de perturbação da IA é muitas vezes maior do que a Salesforce poderia ser.” De fato, eles perguntam: “Quanto de trabalho a IA + automação e o modelo de Serviço como Software eliminarão? Nós acreditamos que esta é uma questão de 4,6 trilhões de dólares.”

Links Referenciados no Programa

Ler a Transcrição

Nota: Esta transcrição foi escrita por IA, graças à Descript, e não foi editada para conteúdo.

[00:00:00] Paul Roetzer: por que a Meta lançaria algo tão poderoso de graça? Por que eles o disponibilizariam para todos? Enquanto o Google cobra por isso, a OpenAI cobra por isso, como já discutimos aqui muitas vezes, é o código aberto bom ou ruim? Isso cria perigos para a sociedade?

[01:06:30] Paul Roetzer: Isso é muito viável. Eu não estou comentando se acho que é uma boa ideia ou não. Parece muito viável, mas eu repetirei novamente, o apelo para fazer essas coisas será imenso. Quando você tem pessoas que entendem o que essas coisas são capazes de fazer e olham para um desafio, como quantas horas, quantas centenas de milhares de horas são gastas entrevistando pessoas todos os anos, e eles dizem, bem, espera, não há nada que eles estejam fazendo que a IA não possa fazer. E talvez até melhor quando você descobrir que eles podem ler emoções em vídeos, analisar a escrita das pessoas.

[01:09:00] Paul Roetzer: […] Portanto, essa é uma realidade muito viável. Estou apenas observando que parece unilateral até o momento.

Agradecemos por ouvir o The AI Show. Visite MarketingAIInstitute.com para continuar sua jornada de aprendizado em IA e se junte a mais de 60.000 profissionais e líderes empresariais que se inscreveram na newsletter semanal, baixaram os planos de IA, participaram de eventos virtuais e presenciais, fizeram nossos cursos online e participaram da comunidade Slack.

Até a próxima, permaneça curioso e explore a IA.



Bolt42