Acabamos de assistir a uma demonstração de um robô humanóide com um cérebro da OpenAI.
A empresa de robótica Figure lançou um vídeo de demonstração mostrando seu robô principal em ação—e esse robô tem um cérebro alimentado por modelos da OpenAI.
No vídeo, o robô conclui tarefas de maneira fluida, como entender palavras faladas, fazer conexões entre entradas visuais, responder verbalmente a comandos e até raciocinar para cumprir solicitações, como entregar uma maçã a um humano quando lhe dizem “estou com fome.”
É apenas o mais recente sinal poderoso de que a explosão da robótica pode estar a caminho.
O que a rápida chegada de robôs inteligentes significa para o futuro do trabalho e da sociedade?
Obtenho as respostas do fundador/CEO do Marketing AI Institute, Paul Roetzer, no episódio 88 do The Artificial Intelligence Show.
Bem-vindo à primeira onda
No episódio 87 do The Artificial Intelligence Show, Roetzer previu que veríamos uma “explosão de robótica” entre 2026 e 2030.
Ele imaginou grandes investimentos em robôs humanóides de players como OpenAI, Tesla e Figure, juntamente com avanços tanto no hardware robótico quanto nos “cérebros”, ou modelos de IA multimodal.
A demonstração da robótica da Figure lançada esta semana se alinha perfeitamente com essa visão. A empresa construiu um robô humanóide impressionante e se associou à OpenAI para alimentá-lo com IA avançada. O resultado é um passo significativo em direção ao futuro dos robôs inteligentes que Roetzer vislumbra no horizonte.
Mas lembre-se, diz Roetzer, ainda é muito cedo.
A demonstração da Figure usando os modelos da OpenAI é incrivelmente impressionante. Mas isso não altera seu cronograma para a verdadeira explosão no desenvolvimento da robótica.
E a Figure não é a única participante neste espaço. Roetzer espera que a Tesla infunda seu robô Optimus com seu próprio modelo de linguagem, Grok, para citar apenas um dos prováveis pesos pesados da robótica.
Como a IA está conferindo “inteligência” aos robôs
O que é realmente revolucionário sobre a demonstração da Figure é a maneira como combina robótica de ponta com IA de última geração. Ao incorporar a IA multimodal da OpenAI em um robô físico, a Figure criou uma máquina capaz de entender e gerar linguagem, raciocinar, planejar e aprender.
Por exemplo, em um segmento do vídeo de demonstração, um humano simplesmente diz ao robô “estou com fome”. O robô consegue deduzir que, dos objetos à sua frente, apenas uma maçã é comestível. Ele pega a maçã e a entrega à pessoa.
“Um robô não poderia fazer isso há um ou dois anos,” diz Roetzer. “O fato de agora poder ver coisas, entender coisas, é realmente o que está acontecendo aqui.”
Como funcionam os robôs inteligentes
Para uma análise mais técnica de como o sistema da Figure funciona, Roetzer aponta para uma excelente thread no X de Corey Lynch, engenheiro sênior de IA de manipulação da Figure.
Agora estamos tendo conversas completas com o Figure 01, graças à nossa parceria com a OpenAI.
Nosso robô pode:
– descrever sua experiência visual
– planejar ações futuras
– refletir sobre sua memória
– explicar seu raciocínio verbalmente
Análise técnica 🧵:pic.twitter.com/6QRzfkbxZY— Corey Lynch (@coreylynch) 13 de março de 2024
Alguns detalhes principais:
- Nenhuma teleoperação humana está envolvida no vídeo de demonstração.
- Imagens das câmeras do robô e falas de seus microfones são alimentadas em um modelo de IA multimodal treinado pela OpenAI.
- A IA processa as imagens e o histórico de conversação para gerar respostas em linguagem, que são faladas de volta ao humano. Ela também é responsável por decidir quais comportamentos aprendidos o robô deve executar para cumprir comandos.
- O robô pode descrever sua experiência visual, planejar ações futuras, refletir sobre sua memória e explicar seu raciocínio verbalmente.
O futuro está chegando rápido
Embora a demonstração da Figure não mude o cronograma de Roetzer de 2026 a 2030, ele acredita que é uma demonstração poderosa do ritmo exponencial de progresso tecnológico em IA e robótica—uma demonstração que devemos levar a sério.
“Eu converso com pessoas o tempo todo que acham que as coisas estão a décadas de distância,” diz Roetzer. “O que eu digo às pessoas é que você não pode afirmar que algo está a décadas de distância agora, porque não compreendemos como é uma curva de crescimento exponencial.”
Conteúdo relacionado
Stagwell Nomeia John Kahan como o Primeiro Diretor de IA
[the_ad id="145565"] A Stagwell, a holding que foi fundada há nove anos pelo presidente e CEO Mark Penn, anunciou a nomeação de John Kahan como seu primeiro diretor de IA.…
4 Principais Conclusões do Relatório Anual da WPP
[the_ad id="145565"] A WPP apresentou seu relatório anual, semanas após desapontar o mercado com resultados de lucros abaixo do esperado para 2024. Além dos números, o…
A Colapso do SEO Está Prestes a Causar Inflação no CPM?
[the_ad id="145565"] Apesar da recente turbulência no mercado, a revolução da IA avança rapidamente, com novas descobertas em modelos e arquiteturas sendo aplicadas em um…