Dois pioneiros da ciência da computação ganharam o Prêmio Turing de 2024 por seu trabalho em aprendizado por reforço, uma disciplina na qual máquinas aprendem por meio de uma abordagem de tentativa e erro baseada em recompensas, permitindo que se adaptem em ambientes dinâmicos ou restritos.
Andrew G. Barto, professor emérito da Universidade de Massachusetts Amherst; e Richard S. Sutton, professor na Universidade de Alberta, desenvolveram algoritmos e teorias fundamentais através de uma série seminal de artigos a partir da década de 1980. Isso inclui um trabalho em uma técnica de reforço chamada aprendizado por diferença temporal; a dupla publicou mais tarde um livro acadêmico intitulado “Aprendizado por Reforço: Uma Introdução.”
O renomado matemático Alan Turing (imagem acima), nomeado em homenagem ao Prêmio Turing, também produziu um artigo na década de 1950 intitulado “Máquinas de Computação e Inteligência” que questionava se os computadores podem pensar e abordava conceitos semelhantes sobre aprendizado com a experiência.
Nos últimos anos, o aprendizado por reforço recebeu mais atenção após a Google DeepMind utilizar a técnica para desenvolver uma IA que derrotou os melhores jogadores de AlphaGo do mundo. E nos últimos meses, a nova empresa de IA chinesa DeepSeek ganhou destaque por seu modelo de raciocínio R1, que se apoiou fortemente no aprendizado por reforço para criar modelos de fundação mais econômicos.

“Prêmio Nobel de Computação”
O Prêmio Turing, administrado pela Association for Computing Machinery (ACM), é frequentemente chamado de “Prêmio Nobel de Computação.” No entanto, o próprio Prêmio Nobel tem invadido o domínio da computação, particularmente em torno da IA; Geoff Hinton e John Hopfield ganharam o Prêmio Nobel de Física por seu trabalho em IA fundamental no ano passado. Isso foi seguido em breve pelo Demis Hassabis e John Jumper da DeepMind, que foram premiados com o Prêmio Nobel de Química por seu trabalho no AlphaFold.
“Áreas de pesquisa que vão desde ciências cognitivas e psicologia até neurociência inspiraram o desenvolvimento do aprendizado por reforço, que lançou as bases para alguns dos avanços mais importantes em IA e nos proporcionou uma visão mais profunda de como o cérebro funciona,” disse o presidente da ACM, Yannis Ioannidis, em um comunicado à imprensa. “O trabalho de Barto e Sutton não é um trampolim que agora superamos. O aprendizado por reforço continua a crescer e oferece grande potencial para novos avanços em computação e muitas outras disciplinas. É apropriado que os estejamos homenageando com o prêmio mais prestigioso de nossa área.”
Outros pioneiros notáveis da IA que ganharam o Prêmio Turing incluem o principal cientista de IA do Meta, Yann LeCun, que recebeu o prêmio em 2018 juntamente com Geoff Hinton e Yoshua Bengio por seu trabalho em redes neurais profundas.
Barto e Sutton compartilharão o prêmio em dinheiro de $1 milhão, que foi fornecido com apoio do Google.
Conteúdo relacionado
AllTrails lança assinatura de $80/ano que inclui rotas inteligentes com tecnologia de IA.
[the_ad id="145565"] AllTrails, o companheiro de caminhadas e ciclismo nomeado como o App do Ano para iPhone de 2023, está lançando uma nova assinatura premium chamada “Peak”,…
Melhorias nos modelos de IA de ‘raciocínio’ podem desacelerar em breve, aponta análise.
[the_ad id="145565"] Uma análise da Epoch AI, um instituto de pesquisa em IA sem fins lucrativos, sugere que a indústria de IA pode não conseguir obter grandes ganhos de…
Co-fundador da Anthropic, Jared Kaplan, virá ao TechCrunch Sessions: AI
[the_ad id="145565"] Está com vontade de aprender mais sobre a Anthropic diretamente da fonte? Você não está sozinho, e é por isso que estamos animados em anunciar que Jared…