Akool Live Camera utiliza inteligência artificial para capturar movimento humano e reproduzir esse movimento com um avatar virtual gerado em tempo real.
Akool também pode traduzir fala em tempo real durante uma reunião virtual e oferecer troca instantânea de rosto durante uma chamada. A tecnologia de IA escuta conversas em um idioma e as traduz instantaneamente para o idioma alvo selecionado, fornecendo áudio sincronizado em tempo real que combina com os movimentos labiais e expressões faciais do avatar.
Essa tecnologia de geração de vídeo deve sua inteligência à IA da Akool, uma startup sediada em Palo Alto, Califórnia, disse Jiajun “Jeff” Lu, CEO da Akool, em uma entrevista ao GamesBeat.
“Nossa principal motivação é melhorar a experiência em tempo real e as experiências ao vivo. Por exemplo, você pode usar avatares para participar de reuniões, pode usar tradução de vídeo para fazer traduções em tempo real, e muitas outras coisas,” disse Lu. “Queremos tornar isso tão real que você não consiga distinguir o avatar de uma pessoa real.”
A empresa também oferece sincronização labial para avatares em tempo real, onde os movimentos labiais do avatar podem corresponder às palavras faladas por uma pessoa em tempo real, disse Lu.
Essa ferramenta Akool Live Camera faz parte do Akool Live Suite, uma coleção inovadora de produtos que apresenta geração de vídeo ao vivo e em tempo real com mínima latência. O conjunto inclui avatares ao vivo, troca de rosto ao vivo, tradução de vídeo e geração de vídeo em tempo real.
“Os produtos que oferecemos são avatares de IA ao vivo, tradução de vídeo, troca de rosto e geração de vídeo de imagem, entre outros,” disse Lu. “Definitivamente, somos muito competitivos no cenário em termos de vídeos centrados no humano, e as coisas que fazemos agora estão disponíveis em tempo real.”
Ele oferece os tipos de visuais hiper-realistas que você esperaria do modelo de geração de vídeo Sora da OpenAI, mas criados instantaneamente e em tempo real, disse Lu.
As implicações do Akool Live Camera são bastante poderosas. Pela primeira vez, um representante de vendas pode apresentar em um espanhol perfeito e sincronizado labialmente falando apenas em inglês. Um CEO pode se dirigir a equipes globais como um avatar digital hiper-realista. Um streamer do Twitch pode transmitir como um personagem de anime sem equipamento caro de captura de movimento. E tudo acontece ao vivo com latência de menos de 100 milissegundos em plataformas como Zoom, Microsoft Teams e Google Meet.
“Akool Live Camera estabelece um novo padrão em tecnologia de geração de vídeo potenciada por IA, indo muito além de prompts textuais e roteirizados,” disse Lu. “Isso abre uma nova gama de possibilidades para reuniões virtuais e transmissões ao vivo, especialmente ao conectar-se com públicos internacionais.”
Um novo paradigma para geração de vídeo ao vivo potenciada por IA

Akool Live Camera não é apenas mais um gerador de vídeo. É uma plataforma interativa que simula
a presença humana de forma dinâmica, analisando entradas de áudio/vídeo ao vivo para gerar avatares responsivos com
expressões e consciência contextual.
Akool Live Camera brilha em ambientes não roteirizados, onde a latência mínima torna humanos sintéticos indistinguíveis da realidade, como transmissões ao vivo, reuniões virtuais e jogos de realidade aumentada. Pelo menos esse é o objetivo, disse Lu.
A inovação reside na capacidade da tecnologia de sintetizar interações humanas sem pré-processamento. A arquitetura de computação em borda do Akool Live Camera processa feeds ao vivo instantaneamente, permitindo que os avatares ajustem emoções, gestos e cadência de fala com base na análise de público em tempo real—um feito semelhante a um diretor de IA improvisando um filme durante a produção ao vivo.
As principais características do Akool Live Camera, todas em tempo real incluem:
● Avatares de IA: Avatares fotorealistas que imitam as expressões, gestos e tons de um falante—respondendo dinamicamente a sinais do público em tempo real.
● Tradução de Vídeo: Traduz instantaneamente a linguagem falada enquanto preserva a identidade vocal e sincroniza os movimentos labiais—permitindo comunicação multilíngue realista durante eventos ao vivo.
● Troca de Rosto ao Vivo: Troca de rostos em tempo real com precisão e retenção de emoção, permitindo que os falantes representem diferentes identidades enquanto mantêm uma performance autêntica. A empresa trabalhou em aplicações com a Coca-Cola e a Qatar Airways.
● Geração de Vídeo de IA: Cria vídeo hiper-realista não roteirizado instantaneamente—sem gravação prévia, roteiro ou pós-produção necessária. O conteúdo é gerado ao vivo, com base no contexto, tom e interação do público.
As principais capacidades do Akool Live Camera incluem:
● Interação ao vivo incomparável: Troca de rosto ao vivo, streaming de avatar e tradução multilíngue durante chamadas/transmissões superam outras soluções pré-gravadas.
● Tradução multilíngue em tempo real: Quebre barreiras linguísticas com traduções vocais sincronizadas que mantêm as nuances do seu discurso original.
● Mapeamento dinâmico de expressões e gestos: Certifique-se de que seu avatar reflita suas emoções e movimentos em tempo real para um engajamento autêntico.
● Versatilidade entre plataformas: Integração suave e fácil com Zoom, Microsoft Teams, Google Meet e mais.
● Design voltado para a privacidade: Avatares profissionais protegem a identidade do usuário em reuniões sensíveis, com processamento local de dados faciais para maior segurança.
● Personalização específica para mercado e público: Aproveite avatares de anime, retro ou voltados para negócios com troca robusta de roupas/personas.
Lu disse que Akool Live Camera muda fundamentalmente o futuro da criação de vídeo ao vivo — não se limita mais apenas a fornecer prompts de texto. A combinação da IA da Akool e do design intuitivo capacita criadores, educadores e empresas a se conectarem de forma mais autêntica e eficiente do que nunca.
Previsto para disponibilidade geral no final de 2025, o Akool Live Camera está pronto para transformar a comunicação global por meio de interações em tempo real potentes por IA. Atualmente em beta e disponível para um grupo seleto de primeiros adotantes, a plataforma oferece um vislumbre exclusivo do futuro do vídeo ao vivo.
Você pode garantir seu acesso antecipado hoje em akool.com/live-camera e ser um dos primeiros a experimentar a próxima era da geração de vídeo ao vivo por IA. Garanta seu acesso antecipado hoje visitando https://akool.com/live-camera.
Origens
Fundada em 2022, a Akool cresceu rapidamente e faturou dezenas de milhões de dólares. Seu portfólio de produtos inclui tradução de vídeo, avatares de streaming em tempo real, troca de rosto de qualidade de estúdio, avatares falantes e o recém-lançado Akool Live Suite—uma coleção inédita de ferramentas em tempo real que possibilita avatares ao vivo, troca de rosto ao vivo e geração dinâmica de vídeo com mínima latência.
Diferentemente do Sora, que cria narrativas a partir de prompts textuais, o Akool Live Camera se destaca em ambientes não roteirizados, como transmissões ao vivo, reuniões virtuais e jogos de AR. O objetivo é aproveitar a baixa latência para tornar humanos sintéticos criados pela Akool indistinguíveis da realidade, disse Lu.
A empresa tem cerca de 80 pessoas atualmente, com membros da equipe que já trabalharam na Apple e no Google. Lu, por sua vez, trabalhou no Google Cloud, focando em processamento de vídeo em nuvem e também trabalhou na Apple no Face ID. Embora a sede seja em Palo Alto, Lu disse que a equipe está espalhada.
Ele afirmou que a equipe não levantou muito dinheiro e, em vez disso, está gerando receita com avatares de IA, troca de rosto e tradução de vídeo. Lu disse que a empresa pode lidar com uma ampla variedade de idiomas em termos de tradução em tempo real.
“Definitivamente, o vídeo de IA está avançando em um ritmo de mudança mais rápido. Estamos acompanhando esse ritmo. Acredito que, a longo prazo, ter uma boa comunidade de usuários será muito importante nos próximos anos,” disse ele. “Eu prevejo que a tecnologia amadurecerá rapidamente.”
Como uma pequena empresa, ele disse que o foco está em desenvolver modelos que sejam melhores para as tarefas que realmente importam para as pessoas.
“Estamos muito à frente nesse jogo ao vivo. Definitivamente, temos engenheiros muito fortes [que] estão otimizando toda a IA para fazê-las funcionar mais rápido. Também temos engenheiros muito fortes para otimizar todo o pipeline para garantir que funcionem bem e proporcionem boas experiências,” disse Lu. “E construímos nossos modelos do zero. Desde o design do modelo até a coleta de dados e todo o pipeline, em vez de usar alguma coisa de código aberto.”
Ele disse que a empresa verifica direitos autorais ao treinar modelos para evitar usar IP do qual não possui direitos.
Eu perguntei o que Lu pensa sobre as preocupações em relação à IA. Ele observou que a IA está recebendo “alta atenção” e seu objetivo é fazer a IA funcionar corretamente. A empresa insere marcas d’água no conteúdo gerado por IA para que não possa ser confundido com humano. A empresa também possui ferramentas de moderação de conteúdo.
GB Daily
Fique por dentro! Receba as últimas notícias em sua caixa de entrada diariamente
Leia nossa Política de Privacidade
Obrigado por se inscrever. Confira mais newsletters da VB aqui.
Ocorreu um erro.
Conteúdo relacionado
O novo modelo R1 de IA da DeepSeek, otimizado para rodar em uma única GPU.
[the_ad id="145565"] O modelo de raciocínio AI R1 atualizado da DeepSeek pode estar recebendo a maior parte da atenção da comunidade de IA esta semana. Mas o laboratório de IA…
O novo recurso da Perplexity pode gerar planilhas, dashboards e muito mais.
[the_ad id="145565"] A Perplexity, o mecanismo de busca impulsionado por IA que desafia o Google, lançou na quinta-feira o Perplexity Labs, uma ferramenta para assinantes do…
O procurador-geral de Delaware supostamente contrata um banco para avaliar o plano de reestruturação da OpenAI.
[the_ad id="145565"] O procurador-geral de Delaware está contratando um banco de investimento para aconselhar sobre a conversão lucrativa da OpenAI, conforme reportado pelo…