Bolt42

Participe de nossas newsletters diárias e semanais para receber as últimas atualizações e conteúdo exclusivo sobre a cobertura de AI líder no setor. Saiba mais


A geração aumentada para recuperação empresarial (RAG) continua sendo fundamental na atual onda de AI autônoma. Aproveitando o interesse crescente em agentes, Cohere lançou a versão mais recente de seu modelo de embeddings com janelas de contexto mais longas e maior multimodalidade.

O Embed 4 da Cohere se baseia nas atualizações multimodais do Embed 3 e adiciona mais capacidades em torno de dados não estruturados. Graças a uma janela de contexto de 128.000 tokens, as organizações podem gerar embeddings para documentos com cerca de 200 páginas.

“Modelos de embedding existentes falham em entender nativamente materiais empresariais multimodais complexos,‬‭ levando as empresas a desenvolverem pipelines de pré-processamento de dados complicados que apenas melhoram levemente a precisão,” disse a Cohere em um post no blog. “O Embed 4 resolve esse problema, permitindo que as empresas e seus colaboradores extraiam eficientemente insights escondidos em montanhas de informações não pesquisáveis.”

As empresas podem implantar o Embed 4 em nuvens privadas virtuais ou em tecnologias locais para maior segurança de dados.

As empresas podem gerar embeddings para transformar seus documentos ou outros dados em representações numéricas para casos de uso de RAG. Agentes podem então se referir a esses embeddings para responder a solicitações.

Conhecimento específico de domínio

O Embed 4 “destaca-se em indústrias regulamentadas” como finanças, saúde e manufatura, afirmou a empresa. A Cohere, que se concentra principalmente em casos de uso de AI empresarial, disse que seus modelos consideram as necessidades de segurança de setores regulamentados e têm um forte entendimento dos negócios.

A empresa treinou o Embed 4 “para ser robusto contra dados reais ruidosos”, mantendo-se preciso apesar das “imperfeições” dos dados empresariais, como erros de ortografia e problemas de formatação.

“Ele também é eficaz na busca por documentos escaneados e escritas à mão. Esses formatos são comuns em documentos legais, faturas de seguro e recibos de despesas. Essa capacidade elimina a necessidade de preparações de dados complicadas ou pipelines de pré-processamento, economizando tempo e custos operacionais para as empresas,” disse a Cohere.

As organizações podem usar o Embed 4 para apresentações a investidores, arquivos de diligência, relatórios de ensaios clínicos, guias de reparo e documentos de produtos. ‭

O modelo suporta mais de 100 idiomas, assim como a versão anterior do modelo.

A Agora, cliente da Cohere, utilizou o Embed 4 para seu motor de busca de AI e descobriu que o modelo poderia encontrar produtos relevantes.

“Os dados de e-commerce são complexos, contendo imagens e descrições de texto multifacetadas. Poder representar nossos produtos em um embedding unificado torna nossa busca mais rápida e nossas ferramentas internas mais eficientes,” disse Param Jaggi, fundador da Agora‬, em um post no blog.

Casos de uso de agentes

A Cohere argumenta que modelos como o Embed 4 melhorariam casos de uso autônomos e afirmam que ele pode ser “o motor de busca ideal” para agentes e assistentes de AI em toda a empresa.

“Além da‬‭ forte precisão em tipos de dados, o modelo oferece eficiência de nível empresarial,” disse a Cohere. “Isso permite que ele escale para atender às demandas de grandes organizações.”

A Cohere acrescentou que o Embed 4 cria embeddings de dados comprimidos para reduzir altos custos de armazenamento.

Embeddings e buscas baseadas em RAG permitem que o agente consulte documentos específicos para cumprir tarefas relacionadas a solicitações. Muitos acreditam que isso fornece resultados mais precisos, garantindo que os agentes não respondam com respostas incorretas ou fabricadas.

Outros modelos de embedding com os quais a Cohere compete incluem o Qodo’s Qodo-Embed-1-1.5B e modelos da Voyage AI, que o fornecedor de banco de dados MongoDB adquiriu recentemente.





    dezenove − 8 =




    Bolt42