Participe de nossas newsletters diárias e semanais para receber as últimas atualizações e conteúdos exclusivos sobre a cobertura de IA de ponta da indústria. Saiba mais
A narrativa da IA alcançou um ponto de inflexão crítico. A inovação do DeepSeek — alcançando desempenho de ponta sem depender dos chips mais avançados — prova o que muitos já afirmaram na NeurIPS em dezembro: o futuro da IA não diz respeito a despejar mais poder computacional nos problemas — mas a repensar como esses sistemas interagem com os humanos e nosso ambiente.
Como cientista da computação educado em Stanford que testemunhou tanto a promessa quanto os perigos do desenvolvimento da IA, vejo este momento como ainda mais transformador do que o lançamento do ChatGPT. Estamos entrando naquilo que alguns chamam de “renascença do raciocínio.” O o1 da OpenAI, o R1 do DeepSeek e outros estão superando a escalabilidade bruta em direção a algo mais inteligente — e fazendo isso com uma eficiência sem precedentes.
Essa mudança não poderia ser mais oportuna. Durante sua palestra na NeurIPS, o ex-cientista-chefe da OpenAI, Ilya Sutskever, declarou que “o pré-treinamento vai acabar” porque, enquanto o poder computacional cresce, estamos limitados por dados da internet finitos. A inovação do DeepSeek valida essa perspectiva — os pesquisadores da empresa chinesa atingiram um desempenho comparável ao o1 da OpenAI a uma fração do custo, demonstrando que a inovação, e não apenas o poder computacional bruto, é o caminho a seguir.
IA avançada sem pré-treinamento massivo
Modelos de mundo estão se destacando para preencher essa lacuna. A recente captação de $230 milhões do World Labs para construir sistemas de IA que compreendam a realidade como os humanos fazem se assemelha à abordagem do DeepSeek, onde seu modelo R1 apresenta momentos de “Eureka” — interrompendo-se para reavaliar problemas, assim como os humanos fazem. Esses sistemas, inspirados por processos cognitivos humanos, prometem transformar tudo, desde modelagem ambiental até interação humano-IA.
Estamos vendo vitórias iniciais: a recente atualização do óculos inteligentes Ray-Ban da Meta permite conversas contínuas e contextuais com assistentes de IA sem palavras de ativação, juntamente com tradução em tempo real. Isso não é apenas uma atualização de recurso — é uma prévia de como a IA pode aprimorar as capacidades humanas sem exigir modelos massivamente pré-treinados.
No entanto, essa evolução traz desafios sutis. Embora o DeepSeek tenha reduzido drasticamente os custos por meio de técnicas de treinamento inovadoras, esse avanço de eficiência pode, paradoxalmente, levar a um aumento no consumo geral de recursos — um fenômeno conhecido como Paradoxo de Jevons, onde melhorias na eficiência tecnológica geralmente resultam em aumento e não diminuição do uso de recursos.
No caso da IA, o treinamento mais barato pode significar mais modelos sendo treinados por mais organizações, potencialmente aumentando o consumo de energia líquido. Mas a inovação do DeepSeek é diferente: ao demonstrar que o desempenho de ponta é possível sem hardware de última geração, eles não estão apenas tornando a IA mais eficiente — estão mudando fundamentalmente nossa abordagem ao desenvolvimento de modelos.
Essa mudança em direção à arquitetura inteligente em vez do poder computacional bruto pode nos ajudar a escapar da armadilha do Paradoxo de Jevons, à medida que o foco se desloca de “quanto poder computacional podemos permitir?” para “quão inteligentemente podemos projetar nossos sistemas?” Como observa o professor da UCLA, Guy Van Den Broeck, “O custo geral do raciocínio de modelos de linguagem certamente não está diminuindo.” O impacto ambiental desses sistemas continua substancial, pressionando a indústria em direção a soluções mais eficientes — exatamente o tipo de inovação que o DeepSeek representa.
Priorizar arquiteturas eficientes
Essa mudança exige novas abordagens. O sucesso do DeepSeek valida o fato de que o futuro não se trata de criar modelos maiores — trata-se de construir modelos mais inteligentes e eficientes que funcionem em harmonia com a inteligência humana e as restrições ambientais.
O cientista-chefe de IA da Meta, Yann LeCun, visualiza sistemas futuros passando dias ou semanas pensando em problemas complexos, muito parecido com os humanos. O modelo R1 do DeepSeek, com sua capacidade de pausar e reconsiderar abordagens, representa um passo em direção a essa visão. Embora intensivo em recursos, essa abordagem poderia gerar avanços em soluções para mudanças climáticas, inovações em saúde e além. Mas, como o Ameet Talwalkar da Carnegie Mellon sabiamente adverte, devemos questionar qualquer um que afirme certeza sobre onde essas tecnologias nos levarão.
Para os líderes empresariais, essa mudança apresenta um caminho claro a seguir. Precisamos priorizar uma arquitetura eficiente, que possa:
- Implantar cadeias de agentes de IA especializados em vez de um único modelo massivo.
- Investir em sistemas que otimizem tanto o desempenho quanto o impacto ambiental.
- Construir infraestrutura que suporte desenvolvimento iterativo, com a intervenção humana em loop.
O que me empolga é que a inovação do DeepSeek prova que estamos superando a era do “maior é melhor” e entrando em algo muito mais interessante. Com o pré-treinamento atingindo seus limites e empresas inovadoras encontrando novas maneiras de alcançar mais com menos, há esse espaço incrível se abrindo para soluções criativas.
Cadeias inteligentes de agentes menores e especializados não são apenas mais eficientes — elas vão nos ajudar a resolver problemas de maneiras que nunca imaginamos. Para startups e empresas dispostas a pensar de forma diferente, este é o nosso momento de nos divertirmos novamente com a IA, de construir algo que realmente faça sentido tanto para as pessoas quanto para o planeta.
Kiara Nirghin é uma tecnóloga premiada de Stanford, autora de sucesso e cofundadora da Chima.
DataDecisionMakers
Bem-vindo à comunidade VentureBeat!
DataDecisionMakers é onde especialistas, incluindo pessoas técnicas que trabalham com dados, podem compartilhar insights e inovações relacionadas a dados.
Se você deseja ler sobre ideias de ponta e informações atualizadas, melhores práticas e o futuro dos dados e da tecnologia de dados, junte-se a nós no DataDecisionMakers.
Você pode até considerar contribuir com um artigo seu!
Leia mais do DataDecisionMakers
Conteúdo relacionado
Impulsionada pela defesa e Starlink, a Orca AI capta US$ 72,5 milhões para sua plataforma de navegação autônoma.
O mercado de navegação autônoma — onde navios, guiados por IA, se conduzem sozinhos, resultando em economia de combustível e tempo — deve ultrapassar US$…
Anduril está trabalhando na desafiadora tarefa de IA relacionada ao processamento em tempo real na borda.
A Anduril anunciou sua nona aquisição na segunda-feira, com a compra da Klas, de Dublin, fabricante de equipamentos de computação em rede robustos para…
Visa lança plataforma de ‘Comércio Inteligente’, permitindo que agentes de IA utilizem seu cartão—com segurança, dizem.
Participe de nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a liderança do setor em IA. Saiba mais…