Participe de nossas newsletters diárias e semanais para receber as últimas atualizações e conteúdo exclusivo sobre a cobertura de AI líder no setor. Saiba mais
A geração aumentada para recuperação empresarial (RAG) continua sendo fundamental na atual onda de AI autônoma. Aproveitando o interesse crescente em agentes, Cohere lançou a versão mais recente de seu modelo de embeddings com janelas de contexto mais longas e maior multimodalidade.
O Embed 4 da Cohere se baseia nas atualizações multimodais do Embed 3 e adiciona mais capacidades em torno de dados não estruturados. Graças a uma janela de contexto de 128.000 tokens, as organizações podem gerar embeddings para documentos com cerca de 200 páginas.
“Modelos de embedding existentes falham em entender nativamente materiais empresariais multimodais complexos, levando as empresas a desenvolverem pipelines de pré-processamento de dados complicados que apenas melhoram levemente a precisão,” disse a Cohere em um post no blog. “O Embed 4 resolve esse problema, permitindo que as empresas e seus colaboradores extraiam eficientemente insights escondidos em montanhas de informações não pesquisáveis.”
As empresas podem implantar o Embed 4 em nuvens privadas virtuais ou em tecnologias locais para maior segurança de dados.
As empresas podem gerar embeddings para transformar seus documentos ou outros dados em representações numéricas para casos de uso de RAG. Agentes podem então se referir a esses embeddings para responder a solicitações.
Conhecimento específico de domínio
O Embed 4 “destaca-se em indústrias regulamentadas” como finanças, saúde e manufatura, afirmou a empresa. A Cohere, que se concentra principalmente em casos de uso de AI empresarial, disse que seus modelos consideram as necessidades de segurança de setores regulamentados e têm um forte entendimento dos negócios.
A empresa treinou o Embed 4 “para ser robusto contra dados reais ruidosos”, mantendo-se preciso apesar das “imperfeições” dos dados empresariais, como erros de ortografia e problemas de formatação.
“Ele também é eficaz na busca por documentos escaneados e escritas à mão. Esses formatos são comuns em documentos legais, faturas de seguro e recibos de despesas. Essa capacidade elimina a necessidade de preparações de dados complicadas ou pipelines de pré-processamento, economizando tempo e custos operacionais para as empresas,” disse a Cohere.
As organizações podem usar o Embed 4 para apresentações a investidores, arquivos de diligência, relatórios de ensaios clínicos, guias de reparo e documentos de produtos.
O modelo suporta mais de 100 idiomas, assim como a versão anterior do modelo.

A Agora, cliente da Cohere, utilizou o Embed 4 para seu motor de busca de AI e descobriu que o modelo poderia encontrar produtos relevantes.
“Os dados de e-commerce são complexos, contendo imagens e descrições de texto multifacetadas. Poder representar nossos produtos em um embedding unificado torna nossa busca mais rápida e nossas ferramentas internas mais eficientes,” disse Param Jaggi, fundador da Agora, em um post no blog.
Casos de uso de agentes
A Cohere argumenta que modelos como o Embed 4 melhorariam casos de uso autônomos e afirmam que ele pode ser “o motor de busca ideal” para agentes e assistentes de AI em toda a empresa.
“Além da forte precisão em tipos de dados, o modelo oferece eficiência de nível empresarial,” disse a Cohere. “Isso permite que ele escale para atender às demandas de grandes organizações.”
A Cohere acrescentou que o Embed 4 cria embeddings de dados comprimidos para reduzir altos custos de armazenamento.
Embeddings e buscas baseadas em RAG permitem que o agente consulte documentos específicos para cumprir tarefas relacionadas a solicitações. Muitos acreditam que isso fornece resultados mais precisos, garantindo que os agentes não respondam com respostas incorretas ou fabricadas.
Outros modelos de embedding com os quais a Cohere compete incluem o Qodo’s Qodo-Embed-1-1.5B e modelos da Voyage AI, que o fornecedor de banco de dados MongoDB adquiriu recentemente.
Insights diários sobre casos de uso empresarial com o VB Daily
Se você quer impressionar seu chefe, o VB Daily tem tudo o que você precisa. Nós fornecemos informações privilegiadas sobre o que as empresas estão fazendo com a AI generativa, desde mudanças regulatórias até implementações práticas, para que você possa compartilhar insights para um ROI máximo.
Leia nossa Política de Privacidade
Obrigado por se inscrever. Confira mais newsletters do VB aqui.
Ocorreu um erro.

Conteúdo relacionado
ChatGPT se refere a usuários pelo nome sem solicitação, e alguns acham isso ‘estranho’
[the_ad id="145565"] Alguns usuários do ChatGPT notaram um fenômeno estranho recentemente: O chatbot ocasionalmente se refere a eles pelo nome enquanto raciocina sobre…
De ‘acompanhar’ a ‘nos acompanhar’: Como o Google silenciosamente assumiu a liderança em IA empresarial.
[the_ad id="145565"] Participe de nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA de ponta. Saiba Mais Há…
Tudo o que você precisa saber sobre o chatbot de IA
[the_ad id="145565"] O ChatGPT, o chatbot de IA geradora de texto da OpenAI, conquistou o mundo desde seu lançamento em novembro de 2022. O que começou como uma ferramenta para…