Dois pioneiros da ciência da computação ganharam o Prêmio Turing de 2024 por seu trabalho em aprendizado por reforço, uma disciplina na qual máquinas aprendem por meio de uma abordagem de tentativa e erro baseada em recompensas, permitindo que se adaptem em ambientes dinâmicos ou restritos.
Andrew G. Barto, professor emérito da Universidade de Massachusetts Amherst; e Richard S. Sutton, professor na Universidade de Alberta, desenvolveram algoritmos e teorias fundamentais através de uma série seminal de artigos a partir da década de 1980. Isso inclui um trabalho em uma técnica de reforço chamada aprendizado por diferença temporal; a dupla publicou mais tarde um livro acadêmico intitulado “Aprendizado por Reforço: Uma Introdução.”
O renomado matemático Alan Turing (imagem acima), nomeado em homenagem ao Prêmio Turing, também produziu um artigo na década de 1950 intitulado “Máquinas de Computação e Inteligência” que questionava se os computadores podem pensar e abordava conceitos semelhantes sobre aprendizado com a experiência.
Nos últimos anos, o aprendizado por reforço recebeu mais atenção após a Google DeepMind utilizar a técnica para desenvolver uma IA que derrotou os melhores jogadores de AlphaGo do mundo. E nos últimos meses, a nova empresa de IA chinesa DeepSeek ganhou destaque por seu modelo de raciocínio R1, que se apoiou fortemente no aprendizado por reforço para criar modelos de fundação mais econômicos.

“Prêmio Nobel de Computação”
O Prêmio Turing, administrado pela Association for Computing Machinery (ACM), é frequentemente chamado de “Prêmio Nobel de Computação.” No entanto, o próprio Prêmio Nobel tem invadido o domínio da computação, particularmente em torno da IA; Geoff Hinton e John Hopfield ganharam o Prêmio Nobel de Física por seu trabalho em IA fundamental no ano passado. Isso foi seguido em breve pelo Demis Hassabis e John Jumper da DeepMind, que foram premiados com o Prêmio Nobel de Química por seu trabalho no AlphaFold.
“Áreas de pesquisa que vão desde ciências cognitivas e psicologia até neurociência inspiraram o desenvolvimento do aprendizado por reforço, que lançou as bases para alguns dos avanços mais importantes em IA e nos proporcionou uma visão mais profunda de como o cérebro funciona,” disse o presidente da ACM, Yannis Ioannidis, em um comunicado à imprensa. “O trabalho de Barto e Sutton não é um trampolim que agora superamos. O aprendizado por reforço continua a crescer e oferece grande potencial para novos avanços em computação e muitas outras disciplinas. É apropriado que os estejamos homenageando com o prêmio mais prestigioso de nossa área.”
Outros pioneiros notáveis da IA que ganharam o Prêmio Turing incluem o principal cientista de IA do Meta, Yann LeCun, que recebeu o prêmio em 2018 juntamente com Geoff Hinton e Yoshua Bengio por seu trabalho em redes neurais profundas.
Barto e Sutton compartilharão o prêmio em dinheiro de $1 milhão, que foi fornecido com apoio do Google.
Conteúdo relacionado
Desbloqueando Sistemas de Texto para Vídeo com Prompts Reescritos
[the_ad id="145565"] Pesquisadores testaram um método para reescrever prompts bloqueados em sistemas de texto-para-vídeo, permitindo que eles ultrapassem filtros de segurança…
Novo codificador de visão totalmente open source, OpenVision, chega para aprimorar o Clip da OpenAI e o SigLIP do Google.
[the_ad id="145565"] Here's the rewritten content in Portuguese, preserving the HTML structure: <div> <div id="boilerplate_2682874" class="post-boilerplate…
A OpenAI acabou de resolver o problema mais irritante do ChatGPT para negócios: conheça a exportação de PDF que muda tudo.
[the_ad id="145565"] Sure! Here’s the rewritten content in Portuguese while keeping the HTML tags intact: <div> <div id="boilerplate_2682874"…