A Microsoft acaba de concluir uma semana intensa de anúncios relacionados à IA.
Baseando-se nos anúncios, parece que a gigante da tecnologia está apostando em três grandes tendências:
IA multimodal, processamento local e a ascensão de agentes de IA.
O que você precisa saber sobre os anúncios?
Consegui as respostas com o fundador e CEO do Marketing AI Institute, Paul Roetzer, no episódio 99 do The Artificial Intelligence Show.
Prepare-se para novos PCs com IA
A Microsoft começou no dia 20 de maio com a apresentação dos Copilot+ PCs.
Essas máquinas com Windows (construídas por parceiros como Dell e Samsung) são projetadas desde o início para IA.
Isso é verdadeiro tanto no nível de hardware quanto de software.
Primeiro, as máquinas são alimentadas por novos chips de alto desempenho chamados unidades de processamento neural (NPU).
Segundo, elas aproveitam tanto os mais recentes modelos de linguagem de grande porte (LLMs) através do Microsoft Azure quanto os poderosos modelos de linguagem pequenos (SLMs) que rodam localmente no dispositivo.
A característica mais marcante desses novos PCs é o Recall, um recurso de IA que rastreia e armazena tudo o que você vê e faz no seu computador.
Segundo a Microsoft, esses dados são mantidos inteiramente no seu dispositivo para garantir a privacidade. Mas isso levanta questões importantes sobre os trade-offs que estamos dispostos a fazer em nome da conveniência proporcionada pela IA.
“Vou permitir que meu computador tire screenshots de tudo o que estou fazendo a cada cinco segundos?”, pergunta Roetzer. “Como funcionário, se formos para o lado corporativo, você não vai ter escolha, eu imagino. Isso é algo que o TI vai ativar ou não.”
Para usuários individuais que se sentem desconfortáveis com o recurso, você pode perder alguns benefícios importantes da IA. Para os funcionários, você pode não ter escolha a não ser ser gravado o tempo todo.
“Eu acho que isso vai ficar confuso,” diz Roetzer.
IA que pode “ver, ouvir, falar e ajudar em tempo real”
No dia seguinte ao anúncio dos PCs Copilot+, a Microsoft deu início à sua conferência Build.
No evento, a Microsoft fez uma porção de anúncios interligados por um tema comum…
A IA multimodal é o futuro.
Vimos isso se concretizando através de alguns anúncios principais:
- A Microsoft anunciou o Phi-3-vision, uma versão multimodal de seu modelo de linguagem pequeno Phi-3, que é pequeno o suficiente para funcionar localmente em um dispositivo.
- A empresa também destacou o GPT-4o, que agora está disponível no Microsoft Azure e possui capacidades multimodais enormemente aprimoradas, incluindo um chat por voz muito melhor.
- Além disso, durante o anúncio dos PCs Copilot+, o novo líder de IA adquirida pela empresa, Mustafa Suleyman, publicou que o Copilot irá “ver, ouvir, falar e ajudar em tempo real” para ajudar você a realizar seu trabalho.
Esse foco multimodal está alinhado com movimentos de empresas como Google, Anthropic e outros líderes de IA. Prepara o cenário para uma IA que pode entender e interagir com o mundo da mesma forma que os humanos.
“Todos eles estão tentando construir IA que pode ver e criar todas essas diferentes modalidades,” diz Roetzer.
“Isso é muito evidente no que a Microsoft está fazendo. Eles estão fazendo isso com as bases dos modelos da OpenAI, mas também aumentando seus próprios modelos.”
Conheça seu novo colega de trabalho em IA
Talvez o mais intrigante seja que a empresa falou bastante sobre agentes de IA que estarão presentes no Copilot.
Esses são assistentes de IA que podem tomar ações independentes. E a Microsoft afirma que você poderá construí-los você mesmo no Copilot ainda este ano.
Um agente de IA promovido pela Microsoft foi o Team Copilot, que terá a capacidade de gerenciar agendas e notas de reuniões, moderar chats de equipe, atribuir tarefas e acompanhar prazos usando aplicativos da Microsoft.
A Microsoft parece estar apostando fortemente em agentes de mensageria como colegas e companheiros de trabalho, e não como substitutos. É uma estratégia que faz sentido, diz Roetzer.
“Acho que há um poder de marca aqui que já vemos com o Google indo nessa direção“, diz Roetzer.
“É uma maneira mais digerível de pensar sobre agentes. As pessoas não pensam nisso como uma substituição se for apresentado a elas como um colega de equipe.”
Processamento local, o tempo todo
Subentendido em todos os anúncios da Microsoft está um claro foco em trazer IA diretamente para os dispositivos sem a necessidade de uma conexão contínua com a nuvem, graças a modelos menores e mais poderosos e melhor hardware.
“Dentro de 12 a 18 meses, muitas das coisas que atualmente precisamos ir à nuvem para realizar, poderemos fazer em nossos dispositivos, seja no seu PC, tablet ou telefone.”
Conteúdo relacionado
40% das Compras Pmax de uma Marca de E-commerce Foram Exibidas em Sites MFA Criados por IA e Domínios Inativos
[the_ad id="145565"] A crescente presença de sites gerados por inteligência artificial voltados para a publicidade está dificultando a tarefa dos anunciantes em garantir que…
Como o Anúncio de Fim de Ano da Coca-Cola com IA Passou de Elogios a Raiva
[the_ad id="145565"] Inicialmente, o remake da Coca-Cola de seu comercial de 1995, “As Férias Estão Chegando,” alimentado por IA, parecia ser bem recebido. A System1, que testa…
Dentro da Estratégia de Dados Focada no Cliente de Chris Marino no Google
[the_ad id="145565"] No episódio deste podcast The Speed of Culture, o fundador e apresentador da Suzy, Matt Britton, conversa com Chris Marino, chefe de agência da Google…