Bolt42

Este artigo faz parte da edição especial da VentureBeat, “IA em Escala: Da Visão à Viabilidade”. Leia mais desta edição especial aqui.

Este artigo faz parte da edição especial da VentureBeat, “IA em Escala: Da Visão à Viabilidade”. Leia mais da edição aqui.

As empresas podem esperar novas capacidades — e decisões estratégicas — em torno da crucial tarefa de criar uma base sólida para a expansão de IA em 2025. Novos chips, aceleradores, co-processadores, servidores e outros hardwares de rede e armazenamento projetados especificamente para IA prometem aliviar as carências atuais e proporcionar um desempenho mais alto, ampliar a variedade e a disponibilidade de serviços e acelerar o tempo para geração de valor.

O panorama em evolução de novas hardware construído para propósitos específicos deve alimentar um crescimento contínuo de dois dígitos na infraestrutura de IA, que a IDC afirma ter durado 18 meses consecutivos. A empresa de TI relata que a compra organizacional de hardware computacional (principalmente servidores com aceleradores) e infraestrutura de armazenamento para IA cresceu 37% ano a ano no primeiro semestre de 2024. As vendas devem triplicar para $100 bilhões por ano até 2028.

“Os gastos combinados em infraestrutura dedicada e pública em nuvem para IA devem representar 42% dos novos gastos em IA em todo o mundo até 2025”, afirma Mary Johnston Turner, VP de pesquisa para estratégias de infraestrutura digital da IDC.

A principal via de expansão da IA

Muitos analistas e especialistas afirmam que esses números impressionantes ilustram que a infraestrutura é a principal via para o crescimento da IA e a transformação digital das empresas. Nesse sentido, eles aconselham líderes tecnológicos e empresariais em empresas tradicionais a tornarem a infraestrutura de IA uma prioridade estratégica, tática e orçamentária crucial em 2025.

“O sucesso com a IA generativa depende de investimentos inteligentes e de uma infraestrutura robusta”,

diz Anay Nawathe, diretor de entrega de nuvem e infraestrutura na ISG, uma firme de pesquisa e consultoria global. “As organizações que se beneficiam da IA generativa redistribuem seus

orçamentos para se concentrar nessas iniciativas.”

Como evidência, Nawathe citou uma recente pesquisa global da ISG que descobriu que, proporcionalmente, as organizações tinham dez projetos na fase piloto e 16 em implantação limitada, mas apenas seis implantados em escala. Um grande culpado, segundo Nawathe, foi a incapacidade da infraestrutura atual de escalar de forma acessível, segura e eficiente. O seu conselho? “Desenvolva práticas de compras abrangentes e maximize a disponibilidade e a utilização de GPU, incluindo a investigação de serviços de nuvem especializados em GPU e IA.”

Outros concordam que, ao expandir pilotos de IA, provas de conceito ou projetos iniciais, é essencial escolher estratégias de implantação que ofereçam a mistura certa de escalabilidade, desempenho, preço, segurança e gerenciabilidade.

Conselhos experientes sobre a estratégia de infraestrutura de IA

Para ajudar as empresas a construir sua estratégia de infraestrutura para a expansão de IA, a VentureBeat consultou mais de uma dúzia de CTOs, integradores, consultores e outros especialistas experientes da indústria, assim como um número igual de pesquisas e relatórios recentes.

As percepções e conselhos, junto com recursos selecionados para exploração mais profunda, podem ajudar a orientar as organizações no caminho mais inteligente para aproveitar o novo hardware de IA e ajudar a impulsionar vantagens operacionais e competitivas.

Estratégia inteligente 1: Comece com serviços de nuvem e híbridos

Para a maioria das empresas, incluindo aquelas que escalam modelos de linguagem grandes (LLMs), os especialistas afirmam que a melhor maneira de se beneficiar de novos chips e hardware específicos para IA é indiretamente — ou seja,

por meio de provedores e serviços em nuvem.

Isso porque grande parte do novo hardware preparado para IA é caro e voltado para gigantescos data centers. A maioria dos novos produtos será adquirida por hiperescaladores como Microsoft, AWS, Meta e Google; provedores de nuvem como Oracle e IBM; gigantes de IA, como XAI e OpenAI e outras empresas de IA dedicadas; e grandes empresas de colocation como Equinix. Todos estão correndo para expandir seus data centers e serviços para obter vantagem competitiva e acompanhar a demanda crescente.

Como a nuvem, consumir infraestrutura de IA como serviço traz várias vantagens, notavelmente iniciar e escalar mais rapidamente, liberdade de preocupações com o pessoal e a conveniência do orçamento pay-go e da despesa operacional (OpEx). Porém, os planos ainda estão sendo elaborados, e os analistas preveem que 2025 trará um desfile de novos serviços em nuvem baseados em poderosos hardware otimizados para IA, incluindo novas opções de ponta a ponta e específicas de indústria.

Estratégia inteligente 2: DIY para os bem-financiados e maduros

O novo hardware otimizado não mudará a realidade atual: a infraestrutura do tipo faça você mesmo (DIY) para IA é mais adequada para empresas bem-financiadas em serviços financeiros, farmacêuticos, saúde, automotiva e outras indústrias altamente competitivas e regulamentadas.

Assim como com a infraestrutura de TI de uso geral, o sucesso requer a capacidade de lidar com altas despesas de capital (CAPEX), operações de IA sofisticadas, pessoal e parceiros com habilidades especializadas, enfrentar quedas na produtividade e aproveitar oportunidades de mercado durante a construção. A maioria das empresas que encarama sua própria infraestrutura o faz para aplicações proprietárias com alto retorno sobre investimento (ROI).

Duncan Grazier, CTO da BuildOps, uma plataforma baseada em nuvem para empreiteiros de construção, ofereceu uma simples diretriz. “Se sua empresa opera dentro de um espaço de problemas estáveis com mecânicas bem conhecidas impulsionando resultados, a decisão permanece simples: o desembolso de capital supera o custo e o tempo para um hiperescalador construir uma solução personalizada para seu problema? Se o novo hardware puder reduzir suas despesas operacionais em 20 a 30%, a matemática frequentemente apoia o investimento inicial ao longo de um período de três anos.”

Apesar de suas exigências rigorosas, o DIY deve crescer em popularidade. Os fornecedores de hardware lançarão novos produtos de IA personalizáveis, incentivando mais e mais organizações maduras a implantar IA proprietária, finamente ajustada, em nuvens privadas ou localmente. Muitos serão motivados pelo desempenho mais rápido de cargas de trabalho específicas, mitigação de desvios de modelo, maior proteção e controle de dados e melhor gerenciamento de custos.

Em última análise, a estratégia mais inteligente, a curto prazo, para a maioria das empresas navegando no novo paradigma de infraestrutura, refletirá as abordagens atuais em nuvem: um híbrido “adequado ao propósito” que combina nuvens públicas e privadas com locais e bordas.

Estratégia inteligente 3: Investigue novos dispositivos de IA amigáveis para empresas

Nem toda organização consegue adquirir GPUs de alto desempenho por $70.000 ou pagar por servidores de IA de $2 milhões. Não desanime: novos hardwares de IA com preços mais realistas para organizações do dia a dia estão começando a surgir.

O Dell AI Factory, por exemplo, inclui Aceleradores de IA, servidores de alto desempenho, armazenamento, redes e software de código aberto em um único pacote integrado. A empresa também anunciou novos servidores PowerEdge e uma série rack integrada 5000 que oferecem infraestrutura de IA energicamente eficiente, com resfriamento a ar e líquido. Grandes fabricantes de computadores continuam a introduzir novos modelos poderosos prontos para IA para processamento descentralizado, móvel e de borda.

O veterano analista da indústria e consultor Jack E. Gold — presidente e analista principal da J. Gold Associates — afirmou que vê um papel crescente para opções menos dispendiosas na aceleração da adoção e crescimento da IA empresarial. A Gartner projeta que até o final de 2026, todos os novos PCs empresariais estarão prontos para IA.

Estratégia inteligente 4: Aprofunde-se nos fundamentos

A tecnologia pode ser nova. Mas a boa notícia é que muitas regras permanecem as mesmas.

“Hardware projetado para IA, como GPUs líderes da indústria da Nvidia, TPUs do Google, chips de wafer Escala da Cerebras e outros, estão tornando as decisões sobre construir versus comprar muito mais nuanceadas,” disse Nawathe da ISG. Mas ele e outros observam que os princípios centrais para tomar essas decisões permanecem amplamente consistentes e familiares. “As empresas ainda estão avaliando a necessidade do negócio, a disponibilidade de habilidades, custos, usabilidade, suporte e os melhores em sua classe versus os melhores da classe.”

Profissionais experientes enfatizam que as decisões mais inteligentes sobre se e como adotar hardware pronto para IA para obter o maior benefício requerem uma análise renovada e disciplinada dos fundamentos de aquisição. Especificamente: impacto no maior stack de IA de software, dados e plataformas e uma revisão minuciosa dos objetivos de IA específicos, orçamentos, custo total de propriedade (TCO) e ROI, requisitos de segurança e conformidade, expertise disponível e compatibilidade com a tecnologia existente.

A energia para operar e resfriar é um grande fator X. Enquanto muito da atenção pública se concentra em novas usinas nucleares miniaturizadas para lidar com o apetite voraz da IA por eletricidade, os analistas afirmam que as empresas não provedoras devem começar a considerar suas próprias despesas energéticas e o impacto da infraestrutura e do uso de IA em seus objetivos de sustentabilidade corporativa.

Comece com casos de uso, não com hardware e tecnologia

Em muitas organizações, a era dos “experimentos científicos” de IA e “objetos brilhantes” está chegando ao fim ou já acabou. A partir de agora, a maioria dos projetos exigirá indicadores-chave de desempenho (KPIs) e ROI claros e alcançáveis. Isso significa que as empresas devem identificar claramente o “porquê” do valor comercial antes de considerar o “como” da infraestrutura tecnológica.

“Você ficaria surpreso com a frequência que essa regra básica é ignorada,” diz Gold.

Sem dúvida, escolher as melhores métricas qualitativas e quantitativas para infraestrutura e iniciativas de IA é um processo complexo, emergente e personalizado.

Comece organizando seus dados primeiro

Da mesma forma, especialistas da indústria — não apenas vendedores de produtos de dados — enfatizam a importância de uma prática recomendada relacionada: começar com os dados. Implantar uma infraestrutura de IA de alto desempenho (ou qualquer outra) sem garantir a qualidade, quantidade, disponibilidade e outros fundamentos dos dados rapidamente levará a resultados ruins e caros.

Juan Orlandini, CTO da América do Norte para soluções globais e integrador de sistemas Insight Enterprises, apontou: “Comprar um desses dispositivos acelerados de IA superpotentes sem realmente fazer o trabalho duro necessário para entender seus dados, como usá-los ou aproveitá-los e se eles são bons é como comprar um firewall sem entender como se proteger.”

A menos que você esteja ansioso para ver como é a situação de entrada de lixo/saída de lixo (GIGO) em esteroides, não cometa esse erro.

E, certifique-se de acompanhar a visão geral, aconselha Kjell Carlsson, responsável pela estratégia de IA na Domino Data Lab, e ex-analista da Forrester. Ele alertou: “As empresas verão pouco benefício dessas novas ofertas de hardware de IA sem atualizar dramaticamente suas capacidades de software para orquestrar, provisionar e governar essa infraestrutura em todas as atividades do ciclo de vida da IA.”

Seja realista sobre as necessidades de infraestrutura de IA

Se sua empresa está usando ou expandindo o CoPilot, Open AI e outros LLMs para produtividade, você provavelmente não precisará de nova infraestrutura por agora, diz Matthew

Chang, principal e fundador da Chang Robotics.

Muitas grandes marcas, incluindo clientes fabricantes da Fortune 500 de sua empresa de engenharia em Jacksonville, Fl., estão obtendo ótimos resultados usando IA como serviço. “Eles não têm

as demandas computacionais,” ele explicou, “então, não faz sentido gastar milhões de dólares em um cluster de computação quando você pode obter o produto de mais alto desempenho no mercado, o Chat GPT Pro, por $200 por mês.”

A IDC aconselha a pensar sobre o impacto da IA em infraestrutura e requisitos de hardware como um espectro. Do impacto mais alto ao mais baixo: Construindo modelos personalizados altamente ajustados, ajustando modelos pré-treinados com dados de primeira parte, contextualizando aplicativos prontos para uso, consumindo aplicativos infundidos em IA “como estão”.
Como você determina a viabilidade mínima da infraestrutura para sua empresa? Saiba mais aqui.

Mantenha-se flexível e aberto para um futuro em rápida mudança

As vendas de hardware de IA especializado devem continuar a aumentar em 2025 e além. A Gartner prevê um aumento de 33%, para $92 bilhões, nas vendas de chips específicos para IA em 2025.

No lado do serviço, as fileiras crescentes de provedores de GPU em nuvem continuam a atrair novos investimentos, com novos participantes incluindo Foundry e clientes corporativos. Uma pesquisa da S&P/Weka descobriu que mais de 30% das empresas já usaram provedores alternativos para inferência e treinamento, muitas vezes porque não conseguiram mais GPUs. Um financiamento privado de $700 milhões superinscrito para o Nebius Group, um provedor de infraestrutura de IA em nuvem de pilha completa, sugere um crescimento ainda maior nesse setor.

A IA já está se movendo de treinamento em gigantescos data centers para inferência na borda em smartphones, PCs e outros dispositivos habilitados para IA. Essa mudança resultará em novos processadores especializados, observou Yvette Kanouff, parceira da JC2 Ventures e ex-chefe da unidade de provedores de serviços da Cisco. “Estou particularmente interessada em ver para onde os chips de inferência vão em termos de permitir mais IA na borda, incluindo inferência em unidades de CPE individuais, economizando recursos e reduzindo a latência em tempo de execução,” disse ela.

Como a tecnologia e o uso estão evoluindo rapidamente, muitos especialistas alertam contra ficar preso a qualquer provedor de serviços ou tecnologia. Há um amplo consenso de que ambientes multi-inquilinos, que espalham a infraestrutura de IA, dados e serviços em dois ou mais provedores de nuvem — é uma estratégia sensata para as empresas.

Srujan Akula, CEO e co-fundador da The Modern Data Company, vai um passo além. Os hiperescaladores oferecem soluções de ponta a ponta convenientes, disse ele, mas suas abordagens integradas tornam os clientes dependentes do ritmo de inovação e das capacidades de uma única empresa. Uma estratégia melhor, sugeriu ele, é seguir padrões abertos e desacoplar armazenamento de computação. Isso permite que uma organização adote rapidamente novos modelos e tecnologias à medida que surgem, em vez de esperar que o fornecedor se atualize.

“As organizações precisam da liberdade para experimentar sem restrições arquitetônicas,” concordou o CTO da BuildOps, Grazier. “Ficar preso a um iPhone 4 enquanto o iPhone 16 Pro está disponível condenaria um aplicativo de consumidor, então, por que deveria ser diferente nesse contexto? A capacidade de transitar facilmente de uma solução para outra sem a necessidade de reconstruir sua infraestrutura é crucial para manter a agilidade e estar à frente em um cenário em rápida evolução.”





    três + dois =




    Bolt42