O próximo grande modelo de IA “aberto” da Meta pode ter um foco em voz, de acordo com um relatório do Financial Times.
Segundo a matéria, a Meta planeja introduzir recursos de voz aprimorados com o Llama 4, o próximo modelo principal de sua família Llama, que deve ser lançado em “semanas.” Aparentemente, a Meta tem focado especialmente em permitir que os usuários interrompam o modelo durante a fala, semelhante ao Modo de Voz da OpenAI para o ChatGPT e à experiência Gemini Live do Google.
Em comentários esta semana durante uma conferência da Morgan Stanley, o diretor de produtos da Meta, Chris Cox, afirmou que o Llama 4 será um modelo “omni”, capaz de interpretar e produzir nativamente fala, além de texto e outros tipos de dados.
O sucesso dos modelos abertos do laboratório de IA chinês DeepSeek, que apresentam desempenho igual ou superior aos modelos Llama da Meta, acelerou o desenvolvimento do Llama. A Meta estaria apressando a criação de salas de guerra para entender como o DeepSeek reduziu o custo de execução e implantação dos modelos.
Conteúdo relacionado
CEO da Perplexity nega ter problemas financeiros e afirma que não haverá IPO antes de 2028.
[the_ad id="145565"] Perplexity O CEO da Perplexity, Aravind Srinivas, recentemente recorreu ao Reddit para abordar as reclamações dos usuários sobre o produto e…
Apple estaria reformulando o app Saúde para incluir um treinador de IA.
[the_ad id="145565"] A Apple está desenvolvendo uma nova versão de seu aplicativo de Saúde que inclui um coach de IA que pode aconselhar os usuários sobre como melhorar sua…
Os modelos de IA mais inovadores: o que fazem e como utilizá-los
[the_ad id="145565"] Modelos de IA estão sendo produzidos a um ritmo alucinante, por todos, desde grandes empresas de tecnologia como Google até startups como OpenAI e…