Participe de nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre cobertura de IA de ponta. Saiba Mais
A IA generativa tornou-se uma parte fundamental da infraestrutura em várias indústrias, e a saúde não é uma exceção. No entanto, conforme organizações como GSK expandem os limites do que a IA generativa pode alcançar, elas enfrentam desafios significativos — especialmente em relação à confiabilidade. Alucinações, ou quando modelos de IA geram informações incorretas ou fabricadas, são um problema persistente em aplicações de alto risco, como a descoberta de medicamentos e assistência médica. Para a GSK, enfrentar esses desafios exige a utilização de escalabilidade de computação em tempo de teste para melhorar os sistemas de IA generativa. Aqui está como eles estão fazendo isso.
O problema das alucinações na saúde generativa
As aplicações na área da saúde exigem um nível excepcionalmente alto de precisão e confiabilidade. Erros não são apenas inconvenientes; podem ter consequências que alteram vidas. Isso torna as alucinações em modelos de linguagem de grande escala (LLMs) uma questão crítica para empresas como a GSK, onde a IA generativa é aplicada em tarefas como revisão de literatura científica, análise genômica e descoberta de medicamentos.
Para mitigar alucinações, a GSK emprega estratégias avançadas de computação em tempo de inferência, incluindo mecanismos de autorreflexão, amostragem de múltiplos modelos e avaliação iterativa de resultados. De acordo com Kim Branson, Vice-Presidente Sênior de IA e aprendizado de máquina (ML) na GSK, essas técnicas ajudam a garantir que os agentes sejam “robustos e confiáveis”, permitindo que os cientistas gerem insights acionáveis mais rapidamente.
Aproveitando a escalabilidade de computação em tempo de teste
A escalabilidade de computação em tempo de teste refere-se à capacidade de aumentar os recursos computacionais durante a fase de inferência de sistemas de IA. Isso permite operações mais complexas, como refinamento iterativo de saída ou agregação de múltiplos modelos, que são críticas para reduzir alucinações e melhorar o desempenho do modelo.
Branson enfatizou o papel transformador da escalabilidade nos esforços de IA da GSK, observando que “estamos focados em aumentar os ciclos de iteração na GSK — como pensamos mais rápido.” Ao usar estratégias como autorreflexão e modelagem em conjunto, a GSK pode aproveitar esses ciclos de computação adicionais para produzir resultados que são tanto precisos quanto confiáveis.
Branson também comentou sobre a tendência mais ampla da indústria, dizendo: “Você está vendo essa guerra acontecendo com quanta capacidade eu posso fornecer, meu custo por token e tempo por token. Isso permite que as pessoas trazem diferentes estratégias algorítmicas que antes não eram tecnicamente viáveis, e isso também impulsionará a implantação e adoção de agentes.”
Estratégias para reduzir alucinações
A GSK identificou alucinações como um desafio crítico na IA generativa para a saúde. A empresa emprega duas estratégias principais que requerem recursos computacionais adicionais durante a inferência. A aplicação de etapas de processamento mais rigorosas garante que cada resposta seja examinada quanto à precisão e consistência antes de ser entregue em ambientes clínicos ou de pesquisa, onde a confiabilidade é fundamental.
Auto-reflexão e revisão iterativa de saída
Uma técnica central é a auto-reflexão, onde LLMs criticam ou editam suas próprias respostas para melhorar a qualidade. O modelo “pensa passo a passo”, analisando sua saída inicial, identificando fraquezas e revisando respostas conforme necessário. A ferramenta de busca de literatura da GSK exemplifica isso: Ela coleta dados de repositórios internos e da memória de um LLM, e então reavalia suas descobertas por meio de auto-crítica para descobrir inconsistências.
Esse processo iterativo resulta em respostas finais mais claras e detalhadas. Branson destacou o valor da auto-crítica, dizendo: “Se você só puder fazer uma coisa, faça isso.” Refinar sua própria lógica antes de entregar resultados permite que o sistema produza insights que estejam alinhados com os rigorosos padrões da área de saúde.
Amostragem multi-modelo
A segunda estratégia da GSK se baseia em múltiplos LLMs ou diferentes configurações de um único modelo para verificar as saídas. Na prática, o sistema pode executar a mesma consulta em várias configurações de temperatura para gerar respostas diversas, empregar versões ajustadas do mesmo modelo especializadas em determinados domínios ou chamar modelos totalmente separados treinados em conjuntos de dados distintos.
Comparar e contrastar essas saídas ajuda a confirmar as conclusões mais consistentes ou convergentes. “Você pode obter esse efeito de ter diferentes maneiras ortogonais de chegar à mesma conclusão,” disse Branson. Embora essa abordagem exija mais poder computacional, ela reduz alucinações e aumenta a confiança na resposta final — um benefício essencial em ambientes críticos de saúde.
As guerras da inferência
As estratégias da GSK dependem de uma infraestrutura que pode lidar com cargas computacionais significativamente mais pesadas. No que Branson chama de “guerras de inferência”, empresas de infraestrutura de IA — como Cerebras, Groq e SambaNova — competem para entregar inovações de hardware que aumentem o throughput de tokens, reduzam a latência e diminuam os custos por token.
Chips e arquiteturas especializadas permitem rotinas de inferência complexas, incluindo amostragem de múltiplos modelos e autorreflexão iterativa, em escala. A tecnologia da Cerebras, por exemplo, processa milhares de tokens por segundo, permitindo que técnicas avançadas funcionem em cenários do mundo real. “Você está vendo os resultados dessas inovações impactando diretamente como podemos implantar modelos generativos de forma eficaz na saúde,” observou Branson.
Quando o hardware acompanha as demandas de software, surgem soluções para manter precisão e eficiência.
Desafios permanecem
Mesmo com esses avanços, escalar recursos computacionais apresenta obstáculos. Tempos de inferência mais longos podem desacelerar fluxos de trabalho, especialmente se clínicos ou pesquisadores precisarem de resultados rápidos. O maior uso de computação também aumenta os custos, exigindo um gerenciamento cuidadoso dos recursos. No entanto, a GSK considera esses compromissos necessários para uma maior confiabilidade e funcionalidade enriquecida.
“À medida que habilitamos mais ferramentas no ecossistema de agentes, o sistema se torna mais útil para as pessoas, e você acaba com um aumento no uso computacional,” observou Branson. Equilibrar desempenho, custos e capacidades do sistema permite que a GSK mantenha uma estratégia prática, mas voltada para o futuro.
O que vem a seguir?
A GSK planeja continuar refinando suas soluções de saúde impulsionadas por IA, com a escalabilidade de computação em tempo de teste como prioridade. A combinação de auto-reflexão, amostragem de múltiplos modelos e infraestrutura robusta ajuda a garantir que os modelos generativos atendam às rigorosas demandas dos ambientes clínicos.
Essa abordagem também serve como um roteiro para outras organizações, ilustrando como reconciliar precisão, eficiência e escalabilidade. Manter uma vantagem no que diz respeito a inovações em computação e técnicas sofisticadas de inferência não só aborda os desafios atuais, mas também prepara o terreno para descobertas na descoberta de medicamentos, cuidados com pacientes e além.
Insights diários sobre casos de uso empresarial com VB Daily
Se você deseja impressionar seu chefe, o VB Daily tem o que você precisa. Nós fornecemos informações privilegiadas sobre o que as empresas estão fazendo com a IA generativa, desde mudanças regulatórias até implantações práticas, para que você possa compartilhar insights para um ROI máximo.
Leia nossa Política de Privacidade
Obrigado por se inscrever. Confira mais boletins da VB aqui.
Ocorreu um erro.

Conteúdo relacionado
OpenAI está supostamente em negociações para comprar a Windsurf por $3 bilhões, com novidades esperadas para esta semana.
[the_ad id="145565"] A Windsurf, fabricante de um popular assistente de codificação por IA, está em negociações para ser adquirida pela OpenAI por cerca de $3 bilhões, segundo…
A OpenAI procurou o criador do Cursor antes de iniciar negociações para comprar a Windsurf por $3 bilhões.
[the_ad id="145565"] Quando a notícia de que a OpenAI estava em negociações para adquirir a empresa de codificação AI Windsurf por $3 bilhões surgiu, uma das primeiras…
Como a IA está redesenhando os mapas de eletricidade do mundo: Insights do Relatório da AIE
[the_ad id="145565"] A inteligência artificial (IA) não está apenas transformando a tecnologia; ela também está mudando de forma significativa o setor energético global. De…