A startup de áudio Krisp anunciou na quarta-feira o lançamento de uma nova funcionalidade que utiliza inteligência artificial para alterar o sotaque de um usuário durante chamadas. A empresa inicialmente irá oferecer suporte para a mudança de sotaques de inglês indiano para inglês americano.
A startup afirma que o processo de conversão de sotaque preserva a voz do falante, alterando apenas os fonemas para se adequar aos sotaques americanos. A funcionalidade foi testada em ambientes empresariais, e uma versão beta já está disponível para o aplicativo desktop do Krisp. Os usuários podem ativar a função a qualquer momento durante ou antes das chamadas.
Arto Minasyan, co-fundador da empresa, disse que a ideia para a funcionalidade surgiu de um problema que ele enfrentou em suas conversas. “Muitas pessoas não entendem meu sotaque, mesmo eu falando inglês corretamente. Pensamos que mudar sotaques poderia ajudar as pessoas a se entenderem muito melhor. Começamos a trabalhar nesse problema há dois anos e agora estamos lançando em beta,” disse Minasyan.
No entanto, quando este repórter testou a funcionalidade, a voz processada não soou natural e, em alguns momentos, algumas palavras foram omitidas. A empresa atribuiu essas falhas ao fato de ser uma versão beta, afirmando que o modelo irá melhorar com o tempo.
A Krisp afirma que, ao testar a funcionalidade com empresas, as taxas de conversão de vendas aumentaram em 26,1% e a receita por livro subiu 14,8%.

A empresa mencionou que decidiu trabalhar primeiro com sotaques indianos, pois as pessoas desse país representam uma grande parte da força de trabalho global em áreas de STEM. Há planos para adicionar suporte a mais sotaques, incluindo o filipino.
Outras startups, como a Sanas, apoiada pela GV, implementaram tecnologia semelhante em call centers em grande escala.
A empresa afirma que treinou o modelo com milhares de amostras de fala que cobriam diferentes sotaques e dialetos, e usou dados de sua assistente de reuniões após obter o consentimento do usuário.
Minasyan disse que outra vantagem da funcionalidade é que não é necessário nenhum pré-treinamento na voz do usuário, pois ele cria um perfil para o falante em tempo real.
A Krisp, que arrecadou capital pela última vez em 2021, planeja lançar aplicativos para iOS e Android este ano para suportar reuniões presenciais. Há também uma nova extensão do Chrome em desenvolvimento para melhor integração com o Google Meet.
Conteúdo relacionado
CEO da Perplexity nega ter problemas financeiros e afirma que não haverá IPO antes de 2028.
[the_ad id="145565"] Perplexity O CEO da Perplexity, Aravind Srinivas, recentemente recorreu ao Reddit para abordar as reclamações dos usuários sobre o produto e…
Apple estaria reformulando o app Saúde para incluir um treinador de IA.
[the_ad id="145565"] A Apple está desenvolvendo uma nova versão de seu aplicativo de Saúde que inclui um coach de IA que pode aconselhar os usuários sobre como melhorar sua…
Os modelos de IA mais inovadores: o que fazem e como utilizá-los
[the_ad id="145565"] Modelos de IA estão sendo produzidos a um ritmo alucinante, por todos, desde grandes empresas de tecnologia como Google até startups como OpenAI e…