Bolt42

A Gladia, fornecedora de inteligência auditiva e transcrição por IA, lançou o Solaria, um modelo de reconhecimento automático de fala (ASR) de próxima geração, projetado para redefinir as comunicações em tempo real para centros de atendimento e outras plataformas centradas na voz.

O Solaria agora capacita empresas a aprimorar e expandir suas operações de atendimento ao cliente com tecnologia de voz impulsionada por IA que oferece cobertura linguística incomparável—suportando mais de 40 idiomas anteriormente inacessíveis com outras soluções—sem comprometer a qualidade ou a velocidade.

Embora a terceirização tenha sido uma estratégia de redução de custos na indústria de call centers, as empresas agora enfrentam um novo desafio crítico: fornecer suporte multilíngue perfeitamente integrado em larga escala. Com 49% dos executivos globais relatando perdas financeiras devido a barreiras linguísticas, a demanda por soluções multilíngues escaláveis e de alta qualidade nunca foi tão grande.

“Observamos no mercado um enorme aumento na IA de voz. É como se a voz fosse parte de nossas vidas novamente, e estamos introduzindo um novo produto chamado Solaria, que é um modelo em tempo real com capacidades avançadas”, disse Jean-Louis Queguiner, CEO da Gladia, em uma entrevista ao GamesBeat. “E ele será o mais rápido do mercado, e o mais preciso, abrangendo 100 idiomas.”

O produto também possui recursos como análise de sentimento em tempo real e tradução em tempo real, disse ele. Ele realiza a tradução e transcrição de fala para texto. Isso é importante para fazer em tempo real para agentes de voz ou call centers, onde alguém pode ter que responder a uma pergunta feita em um idioma diferente.

Solaria: Um modelo pronto para empresas para a experiência global do cliente

O Solaria é um motor de fala para texto (STT) construído para escalabilidade global. O Solaria foi projetado para atender às demandas dos centros de contato atuais, onde tanto a automação com IA quanto os agentes humanos precisam de suporte multilíngue de alta precisão, baixa latência e em tempo real para ter sucesso.

O modelo alcança resultados líderes da indústria em reconhecimento de fala, oferecendo tanto precisão quanto velocidade de processamento rápida. Benchmarks recentes mostram que o Solaria alcançou uma média incomparável de 94% na Taxa de Precisão de Palavras (WAR) em inglês, espanhol, francês e outros idiomas comuns, enquanto mantém uma latência ultra-baixa de 270 milissegundos, fazendo a conversa parecer natural e responsiva.

Embora o reconhecimento de fala em tempo real seja frequentemente medido apenas pela velocidade, precisão e cobertura linguística também são cruciais para as empresas que prestam serviços perfeitos em várias regiões.

Ao contrário de outros modelos de fala para texto que priorizam a velocidade em vez da usabilidade, o Solaria equilibra precisão e velocidade líderes do setor com cobertura linguística incomparável—100 idiomas no total, com suporte exclusivo para 42 idiomas que não são igualados pelos concorrentes. Para mercados de alta população e principais centros de terceirização, como Bangladesh, Índia e Filipinas, a precisão em nível nativo em idiomas regionais agora é oferecida por meio do Solaria.

Com transcrição em nível nativo, mudança de código em tempo real e tradução em todos os idiomas suportados, as empresas podem se expandir para mercados globais sem restrições.

Projetado para automação de voz em escala empresarial, o Solaria oferece:

Precisão de classe mundial em idiomas de alta população, como tagalo, bengali, punjabi, tâmil, urdu, persa e marathi.

Capacidade de adaptar o modelo à terminologia específica de setores (como jargão médico ou financeiro) e extrair dados críticos, como nomes, endereços e numéricos.

Processamento de fala adaptativo, garantindo alta precisão em ambientes barulhentos de call center.

Segurança de dados de nível empresarial, em total conformidade com o GDRP, HIPAA e SOC 2.

Com a adição do Solaria ao seu portfólio de produtos, a Gladia permite que as empresas melhorem o atendimento ao cliente aprimorando agentes de voz impulsionados por IA, tornando IVRs e assistentes virtuais mais confiáveis em vários idiomas, além de otimizar fluxos de trabalho assistidos por humanos com transcrições e traduções em tempo real para ajudar os agentes a fornecer assistência mais eficaz.

“A fala é a maneira mais natural de se conectar com o mundo—pela primeira vez, o reconhecimento automático de fala está fechando a lacuna, permitindo que humanos e IA realmente falem a mesma língua,” disse Jean-Louis Quéguiner, CEO da Gladia, em uma declaração. “Com o Solaria, fizemos um grande avanço na tecnologia de voz impulsionada por IA que desbloqueia novas oportunidades para as empresas, aumentando a eficiência e proporcionando experiências de cliente mais suaves e impactantes em diversos idiomas e mercados. O Solaria foi projetado para plataformas de voz de próxima geração que estão prontas para liderar essa transformação em escala global.”

Atendendo mais de 700 clientes empresariais em todo o mundo, incluindo Attention, Circleback, Method Financial e VEED.IO, a Gladia oferece um serviço e escalabilidade de nível empresarial, respaldados por suporte e infraestrutura dedicados nos EUA e Europa, garantindo desempenho confiável para aplicações críticas. Empresas que buscam escalar globalmente, otimizar custos operacionais e melhorar experiências de clientes podem começar a construir com a API da Gladia hoje.

Como parte do lançamento do Solaria, a Gladia fez uma parceria com a LiveKit, uma estrutura de desenvolvedor open-source de ponta para agentes de voz em tempo real, para impulsionar a tradução multilíngue em tempo real dentro de aplicações movidas por IA. Isso oferece aos desenvolvedores capacidades linguísticas globais prontas para uso através da integração com a API da Gladia.

Após sua rodada de financiamento de Série A de $16 milhões em 2024 e o lançamento do Solaria hoje, a Gladia deu mais um passo crítico rumo a se estabelecer como uma fornecedora líder de infraestrutura de áudio API de ponta a ponta—combinando reconhecimento de fala, IA generativa e capacidades de geração de voz para ajudar usuários corporativos e desenvolvedores a aproveitarem ao máximo o potencial dos dados de áudio em tempo real.

A Gladia, com sede em Paris, foi fundada em 2022 por Jean-Louis Queguiner (ex-OVHCloud) e Jonathan Soto (ex-MIT/Sigfox). O produto da Gladia foi adotado por mais de 150.000 usuários e 700 clientes empresariais—including líderes da indústria como Attention, Circleback, Method Financial e VEED.IO.

Há um atraso de 300 milissegundos entre o momento em que você começa a falar e o momento em que recebe o primeiro evento de voz ativado. Leva 100 milissegundos para fazer a transcrição, então você tem resultados quase instantâneos.

Para melhorar ainda mais a precisão, Queguiner disse que a empresa precisa treinar com mais dados. E precisa trabalhar com as ampliações de dados para tornar os dados mais robustos. A empresa tem preços de nível empresarial, mas ainda não divulgou. Ele disse que será uma das soluções mais acessíveis do mercado.

A empresa conta com quase 40 funcionários.





    14 − treze =




    Bolt42