Acabamos de assistir a uma demonstração de um robô humanóide com um cérebro da OpenAI.
A empresa de robótica Figure lançou um vídeo de demonstração mostrando seu robô principal em ação—e esse robô tem um cérebro alimentado por modelos da OpenAI.
No vídeo, o robô conclui tarefas de maneira fluida, como entender palavras faladas, fazer conexões entre entradas visuais, responder verbalmente a comandos e até raciocinar para cumprir solicitações, como entregar uma maçã a um humano quando lhe dizem “estou com fome.”
É apenas o mais recente sinal poderoso de que a explosão da robótica pode estar a caminho.
O que a rápida chegada de robôs inteligentes significa para o futuro do trabalho e da sociedade?
Obtenho as respostas do fundador/CEO do Marketing AI Institute, Paul Roetzer, no episódio 88 do The Artificial Intelligence Show.
Bem-vindo à primeira onda
No episódio 87 do The Artificial Intelligence Show, Roetzer previu que veríamos uma “explosão de robótica” entre 2026 e 2030.
Ele imaginou grandes investimentos em robôs humanóides de players como OpenAI, Tesla e Figure, juntamente com avanços tanto no hardware robótico quanto nos “cérebros”, ou modelos de IA multimodal.
A demonstração da robótica da Figure lançada esta semana se alinha perfeitamente com essa visão. A empresa construiu um robô humanóide impressionante e se associou à OpenAI para alimentá-lo com IA avançada. O resultado é um passo significativo em direção ao futuro dos robôs inteligentes que Roetzer vislumbra no horizonte.
Mas lembre-se, diz Roetzer, ainda é muito cedo.
A demonstração da Figure usando os modelos da OpenAI é incrivelmente impressionante. Mas isso não altera seu cronograma para a verdadeira explosão no desenvolvimento da robótica.
E a Figure não é a única participante neste espaço. Roetzer espera que a Tesla infunda seu robô Optimus com seu próprio modelo de linguagem, Grok, para citar apenas um dos prováveis pesos pesados da robótica.
Como a IA está conferindo “inteligência” aos robôs
O que é realmente revolucionário sobre a demonstração da Figure é a maneira como combina robótica de ponta com IA de última geração. Ao incorporar a IA multimodal da OpenAI em um robô físico, a Figure criou uma máquina capaz de entender e gerar linguagem, raciocinar, planejar e aprender.
Por exemplo, em um segmento do vídeo de demonstração, um humano simplesmente diz ao robô “estou com fome”. O robô consegue deduzir que, dos objetos à sua frente, apenas uma maçã é comestível. Ele pega a maçã e a entrega à pessoa.
“Um robô não poderia fazer isso há um ou dois anos,” diz Roetzer. “O fato de agora poder ver coisas, entender coisas, é realmente o que está acontecendo aqui.”
Como funcionam os robôs inteligentes
Para uma análise mais técnica de como o sistema da Figure funciona, Roetzer aponta para uma excelente thread no X de Corey Lynch, engenheiro sênior de IA de manipulação da Figure.
Agora estamos tendo conversas completas com o Figure 01, graças à nossa parceria com a OpenAI.
Nosso robô pode:
– descrever sua experiência visual
– planejar ações futuras
– refletir sobre sua memória
– explicar seu raciocínio verbalmente
Análise técnica 🧵:pic.twitter.com/6QRzfkbxZY— Corey Lynch (@coreylynch) 13 de março de 2024
Alguns detalhes principais:
- Nenhuma teleoperação humana está envolvida no vídeo de demonstração.
- Imagens das câmeras do robô e falas de seus microfones são alimentadas em um modelo de IA multimodal treinado pela OpenAI.
- A IA processa as imagens e o histórico de conversação para gerar respostas em linguagem, que são faladas de volta ao humano. Ela também é responsável por decidir quais comportamentos aprendidos o robô deve executar para cumprir comandos.
- O robô pode descrever sua experiência visual, planejar ações futuras, refletir sobre sua memória e explicar seu raciocínio verbalmente.
O futuro está chegando rápido
Embora a demonstração da Figure não mude o cronograma de Roetzer de 2026 a 2030, ele acredita que é uma demonstração poderosa do ritmo exponencial de progresso tecnológico em IA e robótica—uma demonstração que devemos levar a sério.
“Eu converso com pessoas o tempo todo que acham que as coisas estão a décadas de distância,” diz Roetzer. “O que eu digo às pessoas é que você não pode afirmar que algo está a décadas de distância agora, porque não compreendemos como é uma curva de crescimento exponencial.”
Conteúdo relacionado
Google Lança Modo de IA para Pesquisas em Múltiplas Etapas
[the_ad id="145565"] O Google anunciou na quarta-feira que está testando um novo Modo de IA para Pesquisa. O programa experimental gera uma página inteira de resultados…
WPP Faz Aposta Significativa em IA com Investimento na Stability AI
[the_ad id="145565"] A WPP está aprofundando seu conjunto de ferramentas de inteligência artificial e fazendo um movimento estratégico em direção à IA generativa com uma…
A Visão da Samsung para o Futuro
[the_ad id="145565"] A promessa da casa inteligente sempre foi conveniência, automação e personalização, mas, por anos, os consumidores lutaram contra ecossistemas fragmentados…