O próximo grande modelo de IA “aberto” da Meta pode ter um foco em voz, de acordo com um relatório do Financial Times.
Segundo a matéria, a Meta planeja introduzir recursos de voz aprimorados com o Llama 4, o próximo modelo principal de sua família Llama, que deve ser lançado em “semanas.” Aparentemente, a Meta tem focado especialmente em permitir que os usuários interrompam o modelo durante a fala, semelhante ao Modo de Voz da OpenAI para o ChatGPT e à experiência Gemini Live do Google.
Em comentários esta semana durante uma conferência da Morgan Stanley, o diretor de produtos da Meta, Chris Cox, afirmou que o Llama 4 será um modelo “omni”, capaz de interpretar e produzir nativamente fala, além de texto e outros tipos de dados.
O sucesso dos modelos abertos do laboratório de IA chinês DeepSeek, que apresentam desempenho igual ou superior aos modelos Llama da Meta, acelerou o desenvolvimento do Llama. A Meta estaria apressando a criação de salas de guerra para entender como o DeepSeek reduziu o custo de execução e implantação dos modelos.
Conteúdo relacionado
Qualcomm adquire divisão de IA generativa da startup vietnamita VinAI
[the_ad id="145565"] A Qualcomm adquiriu a divisão de IA generativa da VinAI, uma empresa de pesquisa em IA com sede em Hanói, por um valor não revelado, conforme anunciado…
Sam Altman afirma que os problemas de capacidade da OpenAI causarão atrasos nos produtos.
[the_ad id="145565"] Em uma série de publicações no X na segunda-feira, o CEO da OpenAI, Sam Altman, afirmou que a popularidade da nova ferramenta de geração de imagens no…
Chefe de pesquisa em IA da Meta planeja deixar a empresa.
[the_ad id="145565"] A VP de pesquisa em IA da Meta, Joelle Pineau, anunciou que está planejando deixar a empresa em uma publicação no Facebook na terça-feira. Pineau afirmou…