A startup de áudio Krisp anunciou na quarta-feira o lançamento de uma nova funcionalidade que utiliza inteligência artificial para alterar o sotaque de um usuário durante chamadas. A empresa inicialmente irá oferecer suporte para a mudança de sotaques de inglês indiano para inglês americano.
A startup afirma que o processo de conversão de sotaque preserva a voz do falante, alterando apenas os fonemas para se adequar aos sotaques americanos. A funcionalidade foi testada em ambientes empresariais, e uma versão beta já está disponível para o aplicativo desktop do Krisp. Os usuários podem ativar a função a qualquer momento durante ou antes das chamadas.
Arto Minasyan, co-fundador da empresa, disse que a ideia para a funcionalidade surgiu de um problema que ele enfrentou em suas conversas. “Muitas pessoas não entendem meu sotaque, mesmo eu falando inglês corretamente. Pensamos que mudar sotaques poderia ajudar as pessoas a se entenderem muito melhor. Começamos a trabalhar nesse problema há dois anos e agora estamos lançando em beta,” disse Minasyan.
No entanto, quando este repórter testou a funcionalidade, a voz processada não soou natural e, em alguns momentos, algumas palavras foram omitidas. A empresa atribuiu essas falhas ao fato de ser uma versão beta, afirmando que o modelo irá melhorar com o tempo.
A Krisp afirma que, ao testar a funcionalidade com empresas, as taxas de conversão de vendas aumentaram em 26,1% e a receita por livro subiu 14,8%.

A empresa mencionou que decidiu trabalhar primeiro com sotaques indianos, pois as pessoas desse país representam uma grande parte da força de trabalho global em áreas de STEM. Há planos para adicionar suporte a mais sotaques, incluindo o filipino.
Outras startups, como a Sanas, apoiada pela GV, implementaram tecnologia semelhante em call centers em grande escala.
A empresa afirma que treinou o modelo com milhares de amostras de fala que cobriam diferentes sotaques e dialetos, e usou dados de sua assistente de reuniões após obter o consentimento do usuário.
Minasyan disse que outra vantagem da funcionalidade é que não é necessário nenhum pré-treinamento na voz do usuário, pois ele cria um perfil para o falante em tempo real.
A Krisp, que arrecadou capital pela última vez em 2021, planeja lançar aplicativos para iOS e Android este ano para suportar reuniões presenciais. Há também uma nova extensão do Chrome em desenvolvimento para melhor integração com o Google Meet.
Conteúdo relacionado
Anthropic transforma a abordagem da IA na educação: o Modo de Aprendizagem do Claude faz os alunos refletirem.
[the_ad id="145565"] Junte-se aos nossos boletins diários e semanais para as últimas novidades e conteúdo exclusivo sobre cobertura de IA de liderança no setor. Saiba mais……
Anthropic lança um plano de chatbot de IA para faculdades e universidades
[the_ad id="145565"] A Anthropic anunciou na quarta-feira que está lançando uma nova camada Claude para Educação, como resposta ao plano ChatGPT Edu da OpenAI. A nova camada é…
O artigo de 145 páginas da DeepMind sobre segurança em AGI pode não convencer os céticos.
[the_ad id="145565"] O Google DeepMind publicou na quarta-feira um documento exaustivo sobre sua abordagem de segurança para AGI, definida de forma ampla como uma IA capaz de…