Bolt42

Com o consumo de conteúdo global aumentando e a demanda por conteúdo em idiomas não ingleses superando a de filmes e programas em inglês, a IMAX está aproveitando a IA para escalar a localização de seus conteúdos originais.

A indústria de entretenimento e mídia cresceu 5% e atingiu $2,8 trilhões em 2023, segundo um relatório da PwC. Espera-se que a indústria continue sua expansão, embora com uma taxa de crescimento anual composta modesta de quase 4%, alcançando $3,4 trilhões nos próximos cinco anos. O conteúdo em idiomas não ingleses está crescendo rapidamente mesmo em mercados de língua inglesa, incluindo os EUA, Reino Unido, Austrália e Canadá. No ano passado, a Netflix relatou um crescimento de 90% na visualização de conteúdo não inglês no Reino Unido ao longo dos últimos três anos.

A IMAX levou tudo isso em consideração e agora está explorando a localização com o uso de IA para alcançar mais espectadores.

Na segunda-feira, a empresa canadense de produção de cinema, conhecida por seus grandes cinemas e experiências imersivas de filmes, anunciou sua parceria com a startup baseada em Dubai Camb.ai para utilizar seus modelos de discurso em IA para traduzir conteúdo original, incluindo documentários.

A Camb.ai, que já implementou sua dublagem em IA e tradução de discurso em eventos esportivos ao vivo e ligas, incluindo o Australian Open, Eurovision Sport, e Major League Soccer, oferece seu modelo Boli para tradução de fala para texto e Mars para emulação de fala. Os modelos estão disponíveis através da plataforma DubStudio da startup, que suporta 140 idiomas, incluindo várias línguas de baixo recurso que não possuem dados significativos na internet.

“Empresas como OpenAI e Anthropic têm uma visão diferente da sociedade,” disse Akshat Prakash, cofundador e CTO da Camb.ai, em uma entrevista exclusiva. “Estão tentando construir modelos que são muito horizontais e podem cobrir uma ampla gama de tarefas. Nós não precisamos fazer isso. Alguns dos nossos modelos têm menos de 100 milhões de parâmetros e são super especializados.”

Prakash, um ex-engenheiro da Apple que trabalhou com a equipe desenvolvendo modelos de IA e ML para a Siri, co-fundou a Camb.ai com seu pai, Avneesh Prakash, no ano passado.

“Estamos a uma geração de distância, e crescendo na Índia. Trinta anos de diferença, encontramos os mesmos desafios linguísticos,” disse o CTO ao TechCrunch.

Ele mencionou que a Camb.ai pré-treinou 70% de seus modelos usando conjuntos de dados licenciados academicamente, que são utilizáveis comercialmente. Os 30% restantes envolvem o ajuste de dados que são obtidos através de parceiros iniciais que utilizam seus modelos para dublagem e tradução baseadas em IA.

“O que nós não fazemos, e temos sido muito cuidadosos para evitar isso, é potencialmente raspar a internet,” afirmou Prakash. “Algumas empresas acreditam que podem se safar disso porque estão construindo um aplicativo ou ferramenta voltada para o consumidor, e acreditam que é aceitável raspar, como 10 petabytes da internet.”

A Camb.ai utiliza uma abordagem “três camadas” para oferecer tradução baseada em IA, composta pela camada de fundação de seus modelos Boli e Mars, a camada de infraestrutura que hospeda esses modelos de IA, e, em seguida, a plataforma DubStudio para a interface.

Diferentemente de outros modelos baseados em IA, o Boli da Camb.ai recebe tokens de fala de entrada, produz tokens de texto de saída no idioma traduzido e retém nuances, afirma Prakash. Uma vez que o Boli gera o texto, o Mars traduz o texto em fala usando o mesmo sinal de áudio de entrada para capturar a performance do áudio real, incluindo sons de fundo, como a trilha sonora da audiência aplaudindo no caso de eventos esportivos, explicou.

Prakash disse ao TechCrunch que a tecnologia da Camb.ai oferece tradução de fala em até 10 idiomas simultaneamente com uma latência de 20 a 30 segundos, que pode ser coberta pelo atraso de streaming e transmissão de 30 a 40 segundos.

A IMAX irá implementar as traduções em IA de forma escalonada, começando com idiomas de alto recurso. A implementação ocorre após testes internos da tecnologia da Camb.ai em seu conteúdo original.

“Embora ainda estejamos nos estágios iniciais da parceria, continuaremos a trabalhar juntos para explorar melhor seu potencial e como isso pode nos levar para frente,” disse Mark Welton, presidente da IMAX Global.

Welton indicou que a implementação da IA ajudará a economizar nos custos de tradução, sem divulgar detalhes específicos.

A Camb.ai atualmente conta com uma equipe de 50 pessoas. Em fevereiro, levantou $4 milhões em uma rodada inicial liderada pela Courtside Ventures. Prakash revelou ao TechCrunch que a startup está fechando uma rodada maior, pré-Series A, para expandir seu alcance e número de funcionários.


    1 × cinco =

    Bolt42