Bolt42

Dois pioneiros da ciência da computação ganharam o Prêmio Turing de 2024 por seu trabalho em aprendizado por reforço, uma disciplina na qual máquinas aprendem por meio de uma abordagem de tentativa e erro baseada em recompensas, permitindo que se adaptem em ambientes dinâmicos ou restritos.

Andrew G. Barto, professor emérito da Universidade de Massachusetts Amherst; e Richard S. Sutton, professor na Universidade de Alberta, desenvolveram algoritmos e teorias fundamentais através de uma série seminal de artigos a partir da década de 1980. Isso inclui um trabalho em uma técnica de reforço chamada aprendizado por diferença temporal; a dupla publicou mais tarde um livro acadêmico intitulado “Aprendizado por Reforço: Uma Introdução.”

O renomado matemático Alan Turing (imagem acima), nomeado em homenagem ao Prêmio Turing, também produziu um artigo na década de 1950 intitulado “Máquinas de Computação e Inteligência” que questionava se os computadores podem pensar e abordava conceitos semelhantes sobre aprendizado com a experiência.

Nos últimos anos, o aprendizado por reforço recebeu mais atenção após a Google DeepMind utilizar a técnica para desenvolver uma IA que derrotou os melhores jogadores de AlphaGo do mundo. E nos últimos meses, a nova empresa de IA chinesa DeepSeek ganhou destaque por seu modelo de raciocínio R1, que se apoiou fortemente no aprendizado por reforço para criar modelos de fundação mais econômicos.

Andrew G. Barto e Richard S. Sutton
Andrew G. Barto e Richard S. SuttonCréditos da Imagem:ACM

“Prêmio Nobel de Computação”

O Prêmio Turing, administrado pela Association for Computing Machinery (ACM), é frequentemente chamado de “Prêmio Nobel de Computação.” No entanto, o próprio Prêmio Nobel tem invadido o domínio da computação, particularmente em torno da IA; Geoff Hinton e John Hopfield ganharam o Prêmio Nobel de Física por seu trabalho em IA fundamental no ano passado. Isso foi seguido em breve pelo Demis Hassabis e John Jumper da DeepMind, que foram premiados com o Prêmio Nobel de Química por seu trabalho no AlphaFold.

“Áreas de pesquisa que vão desde ciências cognitivas e psicologia até neurociência inspiraram o desenvolvimento do aprendizado por reforço, que lançou as bases para alguns dos avanços mais importantes em IA e nos proporcionou uma visão mais profunda de como o cérebro funciona,” disse o presidente da ACM, Yannis Ioannidis, em um comunicado à imprensa. “O trabalho de Barto e Sutton não é um trampolim que agora superamos. O aprendizado por reforço continua a crescer e oferece grande potencial para novos avanços em computação e muitas outras disciplinas. É apropriado que os estejamos homenageando com o prêmio mais prestigioso de nossa área.”

Outros pioneiros notáveis da IA que ganharam o Prêmio Turing incluem o principal cientista de IA do Meta, Yann LeCun, que recebeu o prêmio em 2018 juntamente com Geoff Hinton e Yoshua Bengio por seu trabalho em redes neurais profundas.

Barto e Sutton compartilharão o prêmio em dinheiro de $1 milhão, que foi fornecido com apoio do Google.


    13 − cinco =

    Bolt42