Participe de nossos boletins informativos diários e semanais para receber as últimas atualizações e conteúdos exclusivos sobre a cobertura de IA de ponta. Saiba Mais
Groq e PlayAI anunciaram hoje uma parceria para lançar o Dialog, um modelo avançado de texto-para-fala, através da plataforma de inferência de alta velocidade da Groq.
A parceria combina a expertise da PlayAI em IA de voz com a infraestrutura de processamento especializada da Groq, criando o que as empresas afirmam ser um dos sistemas de texto-para-fala mais naturais e responsivos disponíveis.
“A Groq oferece um sistema completo e de baixa latência para reconhecimento automático de fala (ASR), GenAI e texto-para-fala, tudo em um só lugar,” disse Ian Andrews, Diretor de Receita da Groq, em uma entrevista exclusiva com a VentureBeat. “Com o Dialog agora operando na GroqCloud, isso significa que os clientes não precisarão usar múltiplos provedores para um único caso de uso — a Groq é uma solução completa.”
Groq impulsiona a primeira IA de voz em árabe, expandindo a presença tecnológica no Oriente Médio
O Dialog é notável por estar disponível tanto em inglês quanto em árabe, sendo a versão em árabe a primeira IA de voz especificamente projetada para a região do Oriente Médio. A inclusão do árabe como uma das ofertas iniciais foi estratégica para ambas as empresas.
“O árabe é a quarta língua mais falada globalmente — ao firmar parceria com a PlayAI para oferecer um modelo TTS em árabe, a Groq está desbloqueando um mercado global chave e permitindo um acesso mais amplo à inferência rápida de IA,” disse Andrews à VentureBeat.
As empresas afirmam que sua solução aborda as principais deficiências nas tecnologias existentes de IA de voz, especialmente em relação aos padrões de fala natural e à velocidade de resposta. De acordo com testes de referência conduzidos pelo avaliador externo Podonos, o Dialog foi preferido pelos usuários na proporção de 10:1 em comparação com ElevenLabs v2.5 Turbo e mais de 3:1 contra ElevenLabs Multilingual v2.0.
Inovador ‘contextualizador de fala adaptativa’ transforma a IA conversacional
O que diferencia o Dialog é sua abordagem sofisticada ao contexto. Em vez de tratar cada vocalização como um evento isolado, o sistema mantém a consciência de todo o fluxo da conversa.
“Construímos uma arquitetura inovadora que chamamos de ‘contextualizador de fala adaptativa’ (ASC), que permite ao modelo usar o contexto completo e a história de uma conversa,” disse Mahmoud Felfel, cofundador e CEO da PlayAI, em uma entrevista com a VentureBeat. “Isso significa que cada resposta não é apenas uma saída isolada; é enriquecida com prosódia, tom e emoção adequados que refletem o fluxo da conversa.”
Para empresas que buscam implementar IA conversacional, a latência — o atraso entre solicitação e resposta — tem sido um desafio persistente. As Unidades de Processamento de Linguagem (LPUs) especializadas da Groq parecem oferecer uma vantagem significativa nesta área.
“Com base em testes internos iniciais, a Groq está entregando até 140 caracteres por segundo no modelo Dialog da PlayAI, um aumento significativo em comparação com o mesmo modelo rodando em GPUs, que entregou 86 caracteres por segundo,” explicou Andrews. “Isso significa que o Dialog gera texto até 10 vezes mais rápido que o tempo real.”
Groq garante investimento de 1,5 bilhão de dólares da Arábia Saudita para construir infraestrutura de IA de classe mundial
A parceria ocorre em um momento de significativa expansão para a Groq, que recentemente garantiu um compromisso de 1,5 bilhão de dólares da Arábia Saudita para financiar infraestrutura adicional. A empresa estabeleceu um centro de dados em Dammam, que descreve como “o maior cluster de inferência da região.”
“Fazer parceria com a Groq foi uma decisão óbvia; eles são líderes do setor em infraestrutura de inferência de IA avançada,” disse Felfel. “Com TTS e agentes, a baixa latência é fundamental. Já otimizamos o Dialog para estas aplicações em tempo real, mas a parceria com a Groq nos permite entregar o modelo de voz de menor latência no mercado.”
O mercado de IA de voz viu um crescimento rápido à medida que as empresas buscam automatizar interações com clientes enquanto mantêm uma experiência natural e semelhante à humana. As aplicações vão desde atendimento ao cliente e automação de vendas até locuções e recursos de acessibilidade para deficientes visuais.
Aplicações empresariais se estendem além dos usos tradicionais em atendimento ao cliente
“Além do atendimento ao cliente, outros casos de uso empresarial incluem automação de vendas e agendamentos de compromissos, integração e assistentes pessoais, criação de locuções para conteúdos existentes, tradução de conteúdo de áudio e vídeo em inglês para árabe, aumento da acessibilidade de sites e conteúdos estáticos para deficientes visuais, e muito mais,” disse Andrews.
Para a PlayAI, fundada por empreendedores da região do Oriente Médio e Norte da África, a inclusão de capacidades em árabe foi particularmente significativa.
“Como fundadores da MENA, sabemos que a região está investindo pesadamente em capacidades e infraestrutura de IA, como demonstrado em investimentos como o da Groq, mas também em uma adoção líder mundial,” disse Felfel. “O árabe é uma língua de negócios global e uma que crescemos falando, portanto, foi uma escolha natural como uma de nossas línguas principais.”
As empresas tornaram a tecnologia Dialog disponível através do modelo de serviço por camadas da GroqCloud, que inclui opções gratuitas e pagas. Essa abordagem permite que os desenvolvedores experimentem a tecnologia antes de se comprometerem com implementações maiores.
“A GroqCloud oferece planos tanto gratuitos quanto pagos. Qualquer pessoa pode criar uma conta e obter um código API gratuitamente,” explicou Andrews. “Nosso nível de desenvolvedor pago é autossuficiente, significando que qualquer um com um cartão de crédito pode se inscrever por conta própria.”
À medida que a voz se torna uma interface cada vez mais importante para sistemas de IA, esta parceria posiciona ambas as empresas para capitalizar sobre a crescente demanda por experiências conversacionais mais naturais e responsivas. Ao abordar os desafios técnicos de latência e padrões de fala natural, a Groq e a PlayAI podem ter removido barreiras significativas à adoção mais ampla da IA de voz em ambientes empresariais.
Insights diários sobre casos de uso empresarial com o VB Daily
Se você quer impressionar seu chefe, o VB Daily tem tudo o que você precisa. Nós fornecemos informações internas sobre o que as empresas estão fazendo com IA generativa, desde mudanças regulatórias até implementações práticas, para que você possa compartilhar insights para obter o máximo ROI.
Leia nossa Política de Privacidade
Obrigado por se inscrever. Confira mais newsletters do VB aqui.
Ocorreu um erro.

Conteúdo relacionado
Drama da demissão de Sam Altman detalhado em novo trecho de livro
[the_ad id="145565"] Um excerto do livro "O Otimista: Sam Altman, OpenAI e a Corrida para Inventar o Futuro" oferece novos detalhes sobre o motivo pelo qual o conselho da…
Nova abordagem para confiabilidade de agentes, AgentSpec, obriga agentes a seguir regras.
[the_ad id="145565"] Participe de nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura líder da indústria em IA. Saiba Mais……
Co-fundador da CoreWeave explica como um armário de GPUs para mineração de criptomoedas levou a um IPO de $1,5 bilhão
[the_ad id="145565"] A CoreWeave começou a negociar na sexta-feira com mais um encolher de ombros do que um grito de guerra. A empresa teve um preço de lançamento de $40 na…