Bolt42

Junte-se aos nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura líder da indústria em IA. Saiba mais


Writer, a empresa de IA generativa empresarial avaliada em $1,9 bilhão, lançou hoje Palmyra X5, um novo modelo de linguagem grande (LLM) com uma janela de contexto expansiva de 1 milhão de tokens, que promete acelerar a adoção de agentes de IA autônomos em ambientes corporativos.

A empresa baseada em San Francisco, que conta com Accenture, Marriott, Uber e Vanguard entre seus centenas de clientes empresariais, posicionou o modelo como uma alternativa econômica em relação a ofertas de gigantes da indústria como OpenAI e Anthropic, com preços estabelecidos em $0,60 por milhão de tokens de entrada e $6 por milhão de tokens de saída.

“Este modelo realmente desbloqueia o mundo agentivo,” disse Matan-Paul Shetrit, Diretor de Produto da Writer, em uma entrevista ao VentureBeat. “É mais rápido e mais barato que modelos equivalentes de grandes janelas de contexto como o GPT-4.1, e quando você combina isso com a grande janela de contexto e a capacidade do modelo de chamar ferramentas ou funções, permite que você comece a realmente fazer coisas como fluxos de trabalho multi-etapa agentivos.”

Uma comparação da eficiência do modelo de IA mostrando que o Palmyra X5 da Writer alcança cerca de 20% de precisão no benchmark MRCR da OpenAI a aproximadamente $0,60 por milhão de tokens, posicionando-o favoravelmente em relação a modelos mais caros como o GPT-4.1 e GPT-4o (direita) que custam mais de $2,00 por milhão de tokens. (Créditos: Writer)

Avanço econômico em IA: Como a Writer treinou um modelo poderoso por apenas $1 milhão

Diferente de muitos concorrentes, a Writer treinou o Palmyra X5 com dados sintéticos por aproximadamente $1 milhão em custos de GPU — uma fração do que outros modelos líderes exigem. Essa eficiência de custos representa uma mudança significativa em relação à abordagem predominante na indústria, que custa dezenas ou centenas de milhões em desenvolvimento de modelos.

“Nossa crença é que, em geral, os tokens estão se tornando cada vez mais baratos, e o processamento também está se tornando mais acessível,” explicou Shetrit. “Estamos aqui para resolver problemas reais, em vez de cobrar centavos de nossos clientes.”

A vantagem de custo da empresa decorre de técnicas proprietárias desenvolvidas ao longo de vários anos. Em 2023, a Writer publicou uma pesquisa sobre “tornar-se auto-instrutivo,” que introduziu critérios de parada antecipada para ajuste mínimo de instruções. Segundo Shetrit, isso permite que a Writer “corte custos significativamente” durante o processo de treinamento.

“Ao contrário de outras empresas fundacionais, nossa visão é que precisamos ser eficazes. Precisamos ser eficientes aqui,” disse Shetrit. “Precisamos fornecer modelos mais rápidos e mais baratos para nossos clientes, porque o ROI realmente importa nesses casos.”

Maravilha de um milhão de tokens: A arquitetura técnica que impulsiona a velocidade e precisão do Palmyra X5

O Palmyra X5 pode processar um prompt completo de um milhão de tokens em aproximadamente 22 segundos e executar chamadas de função em várias etapas em cerca de 300 milissegundos — métricas de desempenho que a Writer afirma que permitem “comportamentos de agentes que antes eram custosos ou demorados.”

A arquitetura do modelo incorpora duas inovações técnicas principais: um mecanismo de atenção híbrido e uma abordagem de mistura de especialistas. “O mecanismo de atenção híbrido…introduz um mecanismo de atenção que dentro do modelo permite que ele se concentre nas partes relevantes das entradas ao gerar cada saída,” disse Shetrit. Essa abordagem acelera a geração de respostas, mantendo a precisão em toda a ampla janela de contexto.

A arquitetura de atenção híbrida do Palmyra X5 processa grandes entradas através de blocos de decodificação especializados, permitindo um manuseio eficiente de contextos de um milhão de tokens. (Créditos: Writer)

Em testes de referência, Palmyra X5 obteve resultados notáveis em relação ao seu custo. No teste MRCR de 8 agulhas da OpenAI — que desafia modelos a encontrar oito solicitações idênticas escondidas em uma conversa massiva — o Palmyra X5 marcou 19,1%, em comparação com 20,25% para o GPT-4.1 e 17,63% para o GPT-4o. Ele também ocupa o oitavo lugar em codificação no benchmark BigCodeBench com uma pontuação de 48,7.

Esses benchmarks demonstram que, embora o Palmyra X5 possa não liderar em todas as categorias de desempenho, ele oferece capacidades quase de topo de gama a custos significativamente mais baixos — um compromisso que a Writer acredita ressoará com clientes empresariais focados no ROI.

De chatbots à automação de negócios: Como os agentes de IA estão transformando fluxos de trabalho empresariais

O lançamento do Palmyra X5 ocorre logo após a Writer apresentar o AI HQ no início deste mês — uma plataforma centralizada para empresas construírem, implantarem e supervisionarem agentes de IA. Essa estratégia de produto dupla posiciona a Writer para capitalizar a crescente demanda empresarial por IA que pode executar processos de negócios complexos de forma autônoma.

“Na era dos agentes, modelos que oferecem menos de 1 milhão de tokens de contexto rapidamente se tornarão irrelevantes para casos de uso críticos para os negócios,” disse o CTO e cofundador da Writer, Waseem AlShikh, em uma declaração.

Shetrit elaborou sobre este ponto: “Por muito tempo, houve uma grande lacuna entre a promessa dos agentes de IA e o que eles poderiam realmente entregar. Mas na Writer, agora estamos vendo implementações de agentes no mundo real com grandes clientes empresariais. E quando digo clientes reais, não estou falando de um caso de uso de agente de viagens. Estou falando de empresas do Global 2000, resolvendo os problemas mais complexos de seus negócios.”

Os primeiros adotantes estão utilizando o Palmyra X5 para diversos fluxos de trabalho empresariais, incluindo relatórios financeiros, respostas a RFPs, documentação de suporte e análise de feedback de clientes.

Um caso de uso particularmente envolvente envolve fluxos de trabalho multi-etapa agentivos, onde um agente de IA pode sinalizar conteúdo desatualizado, gerar revisões sugeridas, compartilhá-las para aprovação humana e automaticamente enviar atualizações aprovadas para um sistema de gerenciamento de conteúdo.

Essa mudança de simples geração de texto para automação de processos representa uma evolução fundamental em como as empresas implantam IA — passando de aumentar o trabalho humano para automatizar funções empresariais inteiras.

O Palmyra X5 da Writer oferece um aumento de 8x no tamanho da janela de contexto em relação ao seu predecessor, permitindo processar o equivalente a 1.500 páginas de uma só vez. (Créditos: Writer)

Estratégia de expansão na nuvem: parceria com a AWS leva a IA da Writer a milhões de desenvolvedores empresariais

Junto com o lançamento do modelo, a Writer anunciou que tanto o Palmyra X5 quanto seu predecessor, Palmyra X4, agora estão disponíveis no Amazon Bedrock, o serviço totalmente gerenciado da Amazon Web Services para acessar modelos fundacionais. A AWS se torna o primeiro provedor de nuvem a entregar modelos totalmente gerenciados da Writer, expandindo significativamente o alcance potencial da empresa.

A integração com a AWS aborda uma barreira crítica para a adoção de IA nas empresas: a complexidade técnica de implantar e gerenciar modelos em larga escala. Ao tornar o Palmyra X5 disponível através da API simplificada da Bedrock, a Writer pode potencialmente alcançar milhões de desenvolvedores que não têm a especialização necessária para trabalhar diretamente com modelos fundacionais.

IA auto-aprendiz: A visão da Writer para modelos que melhoram sem intervenção humana

A Writer fez uma afirmação ousada em relação às janelas de contexto, anunciando que 1 milhão de tokens será o tamanho mínimo para todos os futuros modelos que lançarem. Esse compromisso reflete a visão da empresa de que um grande contexto é essencial para agentes de IA de nível empresarial que interagem com múltiplos sistemas e fontes de dados.

Olhando para o futuro, Shetrit identificou modelos auto-evolutivos como o próximo grande avanço na IA empresarial. “A realidade é que hoje, os agentes não desempenham no nível que queremos e precisamos que eles desempenhem,” disse ele. “O que acho realista é que, à medida que os usuários vão para o AI HQ, eles começam fazendo esse mapeamento de processos… e então você sobrepõe a isso, ou dentro dele, os modelos auto-evolutivos que aprendem com a forma como você faz as coisas na sua empresa.”

Essas capacidades auto-evolutivas mudariam fundamentalmente como os sistemas de IA melhoram com o tempo. Em vez de exigir re-treinamentos periódicos ou ajustes por especialistas em IA, os modelos aprenderiam continuamente a partir de suas interações, melhorando gradualmente seu desempenho para casos de uso específicos nas empresas.

“Essa ideia de que um agente pode dominar todos não é realista,” observou Shetrit ao discutir as necessidades variadas de diferentes equipes de negócios. “Mesmo duas equipes de produtos diferentes, elas têm muitas maneiras tão diferentes de trabalhar, os próprios gerentes de produto.”

A nova matemática da IA empresarial: Como a estratégia de $1,9B da Writer desafia a OpenAI e a Anthropic

A abordagem da Writer contrasta fortemente com a de OpenAI e Anthropic, que levantaram bilhões em financiamento, mas se concentram mais no desenvolvimento de IA de uso geral. A Writer, por sua vez, se concentrou na construção de modelos específicos para empresas com perfis de custo que permitem uma ampla implantação.

Essa estratégia atraiu um interesse significativo dos investidores, com a empresa levantando $200 milhões em financiamento da Série C em novembro passado, com uma avaliação de $1,9 bilhão. A rodada foi co-liderada por Premji Invest, Radical Ventures e ICONIQ Growth, com a participação de investidores estratégicos, incluindo Salesforce Ventures, Adobe Ventures e IBM Ventures.

Segundo a Forbes, a Writer possui uma notável taxa de retenção líquida de 160%, indicando que os clientes geralmente ampliam seus contratos em 60% após a adoção inicial. A empresa possui, ao que tudo indica, mais de $50 milhões em contratos assinados e projeta que isso dobrará para $100 milhões este ano.

Para as empresas avaliando investimentos em IA generativa, o Palmyra X5 da Writer apresenta uma proposta de valor convincente: capacidades poderosas a uma fração do custo de soluções concorrentes. À medida que o ecossistema de agentes de IA amadurece, a aposta da empresa em modelos focados em custos poderia posicioná-la de forma vantajosa em relação a concorrentes melhor financiados que podem não estar tão sintonizados com os requisitos de ROI dos negócios.

“Nosso objetivo é impulsionar a adoção generalizada de agentes em nossa base de clientes o mais rápido possível,” enfatizou Shetrit. “A economia é simples — se definirmos um preço muito alto para nossa solução, as empresas simplesmente compararão o custo de um agente de IA com um trabalhador humano e podem não ver valor suficiente. Para acelerar a adoção, precisamos entregar tanto velocidade superior quanto custos significativamente mais baixos. Essa é a única maneira de alcançar a implantação em larga escala desses agentes dentro de grandes empresas.”

Em uma indústria frequentemente intrigada pelas capacidades técnicas e tetos de desempenho teóricos, o foco pragmático da Writer na eficiência de custos pode acabar provando ser mais revolucionário do que mais um ponto decimal de melhoria em benchmarks. À medida que as empresas se tornam cada vez mais sofisticadas em medir o impacto da IA nos negócios, a pergunta pode mudar de “Qual é o poder do seu modelo?” para “Quão acessível é sua inteligência?” — e a Writer está apostando seu futuro que a economia, não apenas as capacidades, determinarão os vencedores da IA nas empresas.





    17 − dezesseis =




    Bolt42