Bolt42

Participe das nossas newsletters diárias e semanais para receber as últimas atualizações e conteúdos exclusivos sobre a cobertura de IA de ponta. Saiba mais


Os fornecedores estão lançando novas ferramentas de IA generativa todos os dias em um mercado que foi comparado ao Velho Oeste. Porém, devido à novidade e ao constante desenvolvimento da tecnologia, isso pode ser extremamente confuso, com os provedores de plataforma fazendo promessas às vezes especulativas.

A empresa de análise de TI GAI Insights espera trazer mais clareza para os tomadores de decisão nas empresas com o lançamento do primeiro guia do comprador conhecido sobre modelos de linguagem de grande escala (LLMs) e IA generativa. A empresa revisou mais de duas dúzias de fornecedores e identificou sete líderes emergentes (a OpenAI está muito à frente do restante). Além disso, modelos proprietários, de código aberto e pequenos estarão em alta demanda em 2025, à medida que a alta administração prioriza os gastos em IA.

“Estamos vendo uma verdadeira migração da conscientização para a experimentação inicial e, realmente, para a colocação de sistemas em produção,” disse Paul Baier, CEO e cofundador da GAI Insights, ao VentureBeat. “Isto está explodindo, IA está transformando toda a pilha de TI empresarial.”

7 líderes emergentes

A GAI Insights — que busca ser o “Gartner da IA generativa” — revisou 29 fornecedores em casos de uso comuns de IA generativa em empresas, como atendimento ao cliente, suporte de vendas, marketing e cadeias de suprimentos. Eles descobriram que a OpenAI permanece firmemente na liderança, ocupando 65% da participação de mercado.

A empresa destaca que a startup possui parcerias com uma infinidade de fornecedores de conteúdo e chips (incluindo a Broadcom, com a qual está desenvolvendo chips). “Obviamente eles são os primeiros, definiram a categoria,” disse Baier. No entanto, ele observou que a indústria está “fragmentando em subcategorias.”

Os seis outros fornecedores que a GAI Insights identificou como líderes emergentes (em ordem alfabética):

  • Amazon (Titan, Bedrock): Tem uma abordagem neutra em relação a fornecedores e é um “ponto único” para implantação. Também oferece infraestrutura de IA customizada na forma de chips de IA especializados, como Trainium e Inferentia.
  • Anthropic (Sonnet, Haiku, Opus): É um “concorrente formidável” da OpenAI, com modelos que possuem janelas de contexto longo e rendimento elevado em tarefas de programação. A empresa também tem um forte foco na segurança da IA e lançou várias ferramentas para uso empresarial este ano, incluindo Artifacts, Computer Use e recuperação contextual.
  • Cohere (Command R): Oferece modelos focados em empresas e capacidades multilíngues, além de implantações em nuvem privada e no local. Seus modelos Embed e Rerank podem melhorar a busca e recuperação com geração aumentada por recuperação (RAG), que é importante para empresas que trabalham com dados internos.
  • CustomGPT: Tem uma oferta sem código e seus modelos apresentam alta precisão e baixas taxas de alucinação. Também possui recursos empresariais, como Sign-On e OAuth, e fornece análises e insights sobre como colaboradores e clientes estão utilizando as ferramentas.
  • Meta (Llama): Apresenta modelos “de ponta” que variam de pequenos e especializados a modelos de fronteira. A série Llama 3 da Meta, com 405 bilhões de parâmetros, rivaliza com o GPT-4o e o Claude 3.5 Sonnet em tarefas complexas como raciocínio, matemática, processamento multilíngue e compreensão de longos contextos.
  • Microsoft (Azure, Phi-3): Adota uma abordagem dupla, aproveitando ferramentas existentes da OpenAI enquanto investe em plataformas proprietárias. A empresa também está reduzindo a dependência de chips ao desenvolver os seus, incluindo Maia 100 e Cobalt 100.

Alguns outros fornecedores que a GAI Insights avaliou incluem SambaNova, IBM, Deepset, Glean, LangChain, LlamaIndex e Mistral AI.

Os fornecedores foram avaliados com base em uma variedade de fatores, incluindo inovação em produtos e serviços; clareza de produto e serviços e benefícios e recursos; histórico de lançamento de produtos e parcerias; compradores-alvo definidos; qualidade das equipes técnicas e experiência da equipe de gestão; relações estratégicas e qualidade dos investidores; dinheiro arrecadado; e valuation.

Enquanto isso, a Nvidia continua a dominar, com 85% de participação no mercado. A empresa continuará a oferecer produtos em toda a pilha de hardware e software, além de inovar e crescer em 2025 a um ritmo “alucinante”.

Ainda que o mercado de IA generativa esteja em suas fases iniciais — apenas 5% das empresas têm aplicações em produção — 2025 verá um crescimento massivo, com 33% das empresas colocando modelos em produção, projetam a GAI Insights. A IA generativa é a prioridade de orçamento líder para CIOs e CTOs em meio a uma queda de 240X nos últimos 18 meses no custo de computação de IA.

Curiosamente, 90% das implantações atuais utilizam LLMs proprietários (em comparação ao de código aberto), uma tendência que a empresa chama de “Possua sua Própria Inteligência.” Isso se deve à necessidade de maior privacidade de dados, controle e conformidade regulatória. Os principais casos de uso da IA generativa incluem suporte ao cliente, programação, resumir, geração de texto e gestão de contratos.

Mas, em última análise, Baier observou que “existe uma explosão em praticamente qualquer caso de uso agora.”

Ele apontou que se estima que 90% dos dados são não estruturados, contidos em e-mails, PDFs, vídeos e outras plataformas, e ficou maravilhado com o fato de que “a IA generativa nos permite falar com máquinas, nos permite desbloquear o valor de dados não estruturados. Nunca poderíamos fazer isso de forma econômica antes. Agora podemos. Existe uma revolução de TI impressionante em andamento agora.”

2025 também verá um número crescente de pequenos modelos de linguagem específicos de vertical (SLMs) emergindo, e modelos de código aberto estarão em demanda, embora sua definição seja polêmica. Haverá também um melhor desempenho com modelos ainda menores, como Gemma (2B a 7B de parâmetros), Phi-3 (3,8 B a 7B de parâmetros) e Llama 3.2 (1B e 3B). A GAI Insights aponta que modelos pequenos são rentáveis e seguros, e que houve desenvolvimentos significativos em tokenização de byte, poda de peso e destilação de conhecimento que estão minimizando o tamanho e aumentando o desempenho.

Além disso, espera-se que a assistência por voz seja a “interface matadora” em 2025, pois oferecem experiências mais personalizadas e a IA em dispositivo deve ver um aumento significativo. “Vemos um verdadeiro boom no próximo ano, quando smartphones começarem a ser enviados com chips de IA embutidos neles,” disse Baier.

Veremos realmente agentes de IA em 2025?

Enquanto os agentes de IA são o assunto em alta nas empresas no momento, permanece a dúvida sobre quão viáveis eles serão no próximo ano. Existem muitas barreiras a serem superadas, observou Baier, como a propagação não regulamentada, agentes de IA tomando decisões “não confiáveis ou questionáveis” e operando com dados de baixa qualidade.

Os agentes de IA ainda não foram totalmente definidos, disse ele, e aqueles em implantação no momento estão principalmente restritos a aplicações internas e implantações de pequeno porte. “Vemos todo o exagero em torno dos agentes de IA, mas ainda levará anos até que sejam amplamente adotados nas empresas,” disse Baier. “Eles são muito promissores, mas não promissores para o próximo ano.”

Fatores a considerar ao implantar IA generativa

Com o mercado tão saturado e as ferramentas tão variadas, Baier ofereceu alguns conselhos importantes para que as empresas comecem. Primeiro, cuidado com o bloqueio de fornecedores e aceite a realidade de que a pilha de TI empresarial continuará a mudar dramaticamente nos próximos 15 anos.

Uma vez que as iniciativas de IA devem vir de cima, Baier sugere que a alta administração faça uma revisão profunda com o conselho para explorar oportunidades, ameaças e prioridades. O CEO e os VPs também devem ter experiência prática (pelo menos três horas para começar). Antes de implantar, considere fazer um piloto de chatbot sem risco usando dados públicos para suportar o aprendizado prático e experimente a IA em dispositivos para operações de campo.

Além disso, as empresas devem designar um executivo para supervisionar a integração, desenvolver um centro de excelência e coordenar projetos, aconselha Baier. Também é igualmente importante realizar políticas de uso de IA generativa e treinamentos. Para apoiar a adoção, publique uma política de uso, conduza treinamento básico e identifique quais ferramentas são aprovadas e qual informação não deve ser inserida.

Por fim, “não proíba o ChatGPT; seus funcionários já estão utilizando,” afirma a GAI.





    17 − 4 =




    Bolt42