Participe do evento confiado por líderes empresariais há quase duas décadas. O VB Transform reúne as pessoas que estão construindo estratégias reais de IA empresarial. Saiba mais
A equipe de pesquisa em aprendizado de máquina da Apple desenvolveu um sistema de IA inovador para gerar imagens de alta resolução que pode desafiar a dominância dos modelos de difusão, a tecnologia que alimenta geradores de imagem populares como DALL-E e Midjourney.
O avanço, detalhado em um artigo de pesquisa publicado na semana passada, apresenta o “STARFlow”, um sistema desenvolvido por pesquisadores da Apple em colaboração com parceiros acadêmicos, que combina fluxos normalizadores com transformadores autorregressivos para alcançar o que a equipe chama de “desempenho competitivo” com modelos de difusão de ponta.
Essa descoberta ocorre em um momento crítico para a Apple, que enfrentou crescentes críticas sobre suas dificuldades com inteligência artificial. Na Worldwide Developers Conference de segunda-feira, a empresa revelou apenas atualizações modestas em IA para sua plataforma Apple Intelligence, destacando a pressão competitiva que enfrenta em um cenário onde muitos a veem como atrasada na corrida pela IA.
“Até onde sabemos, este trabalho é a primeira demonstração bem-sucedida de fluxos normalizadores operando efetivamente em grande escala e resolução,” escreveram a equipe de pesquisa, que inclui os pesquisadores de aprendizado de máquina da Apple Jiatao Gu, Joshua M. Susskind e Shuangfei Zhai, juntamente com colaboradores acadêmicos de instituições como Universidade da Califórnia, Berkeley e Georgia Tech.
Como a Apple está reagindo contra a OpenAI e o Google nas guerras de IA
A pesquisa STARFlow representa o esforço mais amplo da Apple para desenvolver capacidades de IA distintas que possam diferenciar seus produtos dos concorrentes. Enquanto empresas como Google e OpenAI dominaram as manchetes com seus avanços em IA generativa, a Apple tem trabalhado em abordagens alternativas que podem oferecer vantagens únicas.
A equipe de pesquisa enfrentou um desafio fundamental na geração de imagens por IA: escalar fluxos normalizadores para funcionar efetivamente com imagens de alta resolução. Os fluxos normalizadores, um tipo de modelo generativo que aprende a transformar distribuições simples em complexas, tradicionalmente foram ofuscados por modelos de difusão e redes adversariais generativas em aplicações de síntese de imagens.
“O STARFlow alcança desempenho competitivo em tarefas de geração de imagens condicionadas por classe e texto, aproximando-se dos modelos de difusão de ponta em qualidade de amostra,” escreveram os pesquisadores, demonstrando a versatilidade do sistema em diferentes tipos de desafios de síntese de imagem.
Dentro do avanço matemático que alimenta o novo sistema de IA da Apple
A equipe de pesquisa da Apple apresentou várias inovações-chave para superar as limitações dos métodos tradicionais de fluxos normalizadores. O sistema utiliza o que os pesquisadores chamam de “design profundo-raso”, usando “um bloco de Transformer profundo [que] captura a maior parte da capacidade representacional do modelo, complementado por alguns blocos de Transformer rasos que são computacionalmente eficientes, mas substancialmente benéficos.”
O avanço também envolve operar no “espaço latente de autoencoders pré-treinados, o que prova ser mais eficaz do que a modelagem direta em nível de pixels,” de acordo com o artigo. Essa abordagem permite que o modelo trabalhe com representações comprimidas de imagens, em vez de dados brutos de pixels, melhorando significativamente a eficiência.
Diferentemente dos modelos de difusão, que dependem de processos iterativos de desnoising, STARFlow mantém as propriedades matemáticas dos fluxos normalizadores, permitindo “treinamento de máxima verossimilhança exata em espaços contínuos sem discretização.”
O que o STARFlow significa para o futuro dos produtos iPhone e Mac da Apple
A pesquisa chega em um momento em que a Apple enfrenta pressão crescente para demonstrar progresso significativo em inteligência artificial. Uma recente análise da Bloomberg destacou como a Apple Intelligence e a Siri têm lutado para competir com os rivais. Os anúncios modestos da Apple na WWDC esta semana sublinharam os desafios da empresa no espaço da IA.
Para a Apple, o treinamento de máxima verossimilhança do STARFlow pode oferecer vantagens em aplicações que exigem controle preciso sobre o conteúdo gerado ou em cenários onde entender a incerteza do modelo é crítico para a tomada de decisões — potencialmente valiosas para aplicações empresariais e capacidades de IA em dispositivos que a Apple enfatizou.
A pesquisa demonstra que abordagens alternativas aos modelos de difusão podem alcançar resultados comparáveis, potencialmente abrindo novas avenidas para inovação que podem se adequar às forças da Apple em integração de hardware e software e processamento em dispositivos.
Por que a Apple está apostando em parcerias universitárias para resolver seu problema de IA
A pesquisa exemplifica a estratégia da Apple de colaborar com instituições acadêmicas renomadas para avançar suas capacidades de IA. O coautor Tianrong Chen, um doutorando na Georgia Tech que fez estágio na equipe de pesquisa em aprendizado de máquina da Apple, traz expertise em controle ótimo estocástico e modelagem generativa.
A colaboração também inclui Ruixiang Zhang do departamento de matemática da U.C. Berkeley e Laurent Dinh, um pesquisador em aprendizado de máquina conhecido por seu trabalho pioneiro em modelos baseados em fluxo na Google Brain e DeepMind.
“Crucialmente, nosso modelo permanece um fluxo normalizador end-to-end,” enfatizaram os pesquisadores, distinguindo sua abordagem de métodos híbridos que sacrificam a tratabilidade matemática por um desempenho melhorado.
O artigo de pesquisa completo está disponível no arXiv, fornecendo detalhes técnicos para pesquisadores e engenheiros que desejam construir sobre este trabalho no competitivo campo da IA generativa. Embora o STARFlow represente uma conquista técnica significativa, o verdadeiro teste será se a Apple conseguirá transformar tais avanços de pesquisa em recursos de IA voltados para o consumidor que fizeram concorrentes como ChatGPT se tornarem nomes conhecidos. Para uma empresa que já revolucionou indústrias inteiras com produtos como o iPhone, a questão não é se a Apple pode inovar em IA — é se eles podem fazer isso rapidamente o suficiente.
A visão diária sobre casos de uso de negócios com o VB Daily
Se você quer impressionar seu chefe, o VB Daily tem tudo coberto. Damos a você a scoop sobre o que as empresas estão fazendo com IA generativa, desde mudanças regulatórias até implantações práticas, para que você possa compartilhar insights para um ROI máximo.
Leia nossa Política de Privacidade
Obrigado por se inscrever. Confira mais newsletters do VB aqui.
Ocorreu um erro.

Conteúdo relacionado
O novo modelo de mundo da Meta permite que robôs manipulem objetos em ambientes nunca antes encontrados.
[the_ad id="145565"] Participe do evento confiável por líderes empresariais há quase duas décadas. O VB Transform reúne as pessoas que constroem a verdadeira estratégia de IA…
Colapso na Nuvem: Replit e LlamaIndex fora do ar devido a falha de identidade do Google Cloud
[the_ad id="145565"] Participe do evento confiável pelos líderes empresariais há quase duas décadas. O VB Transform reúne as pessoas que estão construindo uma verdadeira…
O Futuro da Publicidade Após um Golpe de Tráfego com IA
[the_ad id="145565"] Modelos de linguagem grandes estão gradualmente substituindo a busca tradicional, não apenas respondendo perguntas de maneira mais direta, mas…