Bolt42

Inscreva-se em nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA líder do setor. Saiba mais


A startup canadense de IA, Cohere — cofundada por um dos autores do artigo original do transformer que deu início à revolução dos modelos de linguagem grande (LLM) em 2017 — hoje apresentou o Command A, seu mais recente modelo de IA generativa projetado para aplicações empresariais.

Como sucessor do Command-R, que foi lançado em março de 2024, e do Command R+ que se seguiu, o Command A se baseia no foco da Cohere em geração aumentada por recuperação (RAG), uso de ferramentas externas e eficiência em IA empresarial — especialmente no que diz respeito ao processamento e à velocidade com que fornece respostas.

Isso o tornará uma opção atraente para empresas que buscam obter uma vantagem em IA sem comprometer o orçamento, e para aplicações onde respostas rápidas são necessárias — como finanças, saúde, medicina, ciência e direito.

Com velocidades mais rápidas, requisitos de hardware mais baixos e capacidades multilíngues expandidas, o Command A se posiciona como uma alternativa sólida a modelos como GPT-4o e DeepSeek-V3 — LLMs clássicos, não os novos modelos de raciocínio que têm causado furor na indústria de IA ultimamente.

Diferente de seu predecessor, que suportava um comprimento de contexto de 128.000 tokens (referindo-se à quantidade de informações que o LLM pode lidar em uma troca de entrada/saída, equivalente a um romance de cerca de 300 páginas), o Command A dobra o comprimento do contexto para 256.000 tokens (equivalente a 600 páginas de texto) ao mesmo tempo que melhora a eficiência geral e a prontidão para empresas.

Ele também foi lançado após a Cohere for AI — a subsidiária sem fins lucrativos da empresa — ter lançado um modelo de visão multilíngue de código aberto (apenas para pesquisa) chamado Aya Vision no início deste mês.

Um passo à frente do Command-R

Quando o Command-R foi lançado no início de 2024, ele apresentou inovações importantes, como desempenho otimizado em RAG, melhor recuperação de conhecimento e implantações de IA de baixo custo.

Ele ganhou tração com empresas, integrando-se a soluções de negócios de empresas como Oracle, Notion, Scale AI, Accenture e McKinsey, embora um relatório de novembro de 2024 da Menlo Ventures sobre adoção empresarial tenha colocado a participação de mercado da Cohere entre as empresas em apenas 3%, bem abaixo da OpenAI (34%), Anthropic (24%) e até mesmo de startups menores como a Mistral (5%).

Agora, na tentativa de se tornar uma opção mais atraente para as empresas, o Command A leva essas capacidades ainda mais longe. De acordo com a Cohere, ele:

  • Iguala ou supera o GPT-4o e o DeepSeek-V3 em tarefas de negócios, STEM e codificação
  • Opera com apenas duas GPUs (A100 ou H100), uma grande melhoria em eficiência em comparação com modelos que requerem até 32 GPUs
  • Alcança uma geração de tokens mais rápida, produzindo 156 tokens por segundo — 1,75x mais rápido que o GPT-4o e 2,4x mais rápido que o DeepSeek-V3
  • Reduz a latência, com um tempo de 6.500ms para o primeiro token, em comparação com 7.460ms para o GPT-4o e 14.740ms para o DeepSeek-V3
  • Fortalece as capacidades de IA multilíngue, com melhor correspondência de dialetos árabes e suporte expandido para 23 idiomas globais.

A Cohere observa em sua documentação para desenvolvedores online: “Command A é conversador. Por padrão, o modelo é interativo e otimizado para conversação, o que significa que é verboso e usa markdown para destacar códigos. Para substituir esse comportamento, os desenvolvedores devem usar um preâmbulo que peça ao modelo para simplesmente fornecer a resposta e para não usar marcadores de markdown ou de bloco de código.”

Construído para empresas

A Cohere continuou sua estratégia focada em empresas com o Command A, garantindo que ele se integre perfeitamente em ambientes de negócios. As principais características incluem:

  • Avançada geração aumentada por recuperação (RAG): Permite respostas verificáveis e de alta precisão para aplicações de empresas
  • Uso de ferramentas agentic: Suporta fluxos de trabalho complexos integrando-se a ferramentas empresariais
  • Integração com a plataforma North AI: Funciona com a plataforma North AI da Cohere, permitindo que empresas automatizem tarefas usando agentes de IA seguros e de nível empresarial
  • Escalabilidade e eficiência de custo: Implantações privadas são até 50% mais baratas que o acesso via API.

Multilíngue e altamente eficiente em árabe

Um recurso destacado do Command A é sua capacidade de gerar respostas precisas em 23 das línguas mais faladas ao redor do mundo, incluindo um melhor tratamento dos dialetos árabes. As línguas suportadas (de acordo com a documentação para desenvolvedores no site da Cohere) são:

  • Inglês
  • Francês
  • Espanhol
  • Italiano
  • Alemão
  • Português
  • Japonês
  • Coreano
  • Chinês
  • Árabe
  • Russo
  • Polonês
  • Turco
  • Vietnamita
  • Holandês
  • Tcheco
  • Indonésio
  • Ucraniano
  • Romeno
  • Gregos
  • Hindi
  • Hebraico
  • Persa

Em avaliações de benchmark:

  • Command A obteve 98,2% de precisão ao responder em árabe a prompts em inglês — superior ao DeepSeek-V3 (94,9%) e ao GPT-4o (92,2%).
  • Ele superou significativamente os concorrentes em consistência de dialeto, alcançando uma pontuação ADI2 de 24,7, em comparação com 15,9 (GPT-4o) e 15,7 (DeepSeek-V3).
Crédito: Cohere

Construído para velocidade e eficiência

A velocidade é um fator crítico para a implantação de IA empresarial, e o Command A foi projetado para fornecer resultados mais rapidamente do que muitos de seus concorrentes.

  • Velocidade de streaming de tokens para requisições de contexto de 100K: 73 tokens/segundo (comparado a 38/segundo do GPT-4o e 32/segundo do DeepSeek-V3)
  • Geração mais rápida do primeiro token: reduz significativamente o tempo de resposta em comparação com outros modelos em larga escala.

Preços e disponibilidade

O Command A está agora disponível na plataforma Cohere e com pesos abertos para uso em pesquisa apenas no Hugging Face sob uma licença Creative Commons Attribution Non Commercial 4.0 International (CC-by-NC 4.0), com maior suporte de provedores de nuvem chegando em breve.

  • Tokens de entrada: $2,50 por milhão
  • Tokens de saída: $10,00 por milhão

Implantações privadas e no local estão disponíveis mediante solicitação.

Reações da indústria

Vários pesquisadores de IA e membros da equipe da Cohere compartilharam seu entusiasmo pelo Command A.

Dwaraknath Ganesan, pré-treinamento na Cohere, comentou no X: “Extremamente empolgado para revelar o que temos trabalhado nos últimos meses! Command A é maravilhoso. Pode ser implantado em apenas 2 GPUs H100! Comprimento de contexto de 256K, suporte multilíngue expandido, uso de ferramentas agentic… muito orgulhoso deste!”

Pierre Richemond, pesquisador de IA na Cohere, acrescentou: “O Command A é nosso novo modelo de 111B com pesos abertos, equivalente ao GPT-4o/deepseek v3, apresentando um comprimento de contexto de 256K que foi otimizado para eficiência em casos de uso empresarial.”

Construindo sobre a base do Command-R, o Command A da Cohere representa o próximo passo em IA empresarial escalável e econômica.

Com velocidades mais rápidas, uma janela de contexto maior, melhor tratamento multilíngue e custos de implantação mais baixos, oferece às empresas uma alternativa poderosa aos modelos de IA existentes.





    dezenove − onze =




    Bolt42