Acabamos de assistir a uma demonstração de um robô humanóide com um cérebro da OpenAI.
A empresa de robótica Figure lançou um vídeo de demonstração mostrando seu robô principal em ação—e esse robô tem um cérebro alimentado por modelos da OpenAI.
No vídeo, o robô conclui tarefas de maneira fluida, como entender palavras faladas, fazer conexões entre entradas visuais, responder verbalmente a comandos e até raciocinar para cumprir solicitações, como entregar uma maçã a um humano quando lhe dizem “estou com fome.”
É apenas o mais recente sinal poderoso de que a explosão da robótica pode estar a caminho.
O que a rápida chegada de robôs inteligentes significa para o futuro do trabalho e da sociedade?
Obtenho as respostas do fundador/CEO do Marketing AI Institute, Paul Roetzer, no episódio 88 do The Artificial Intelligence Show.
Bem-vindo à primeira onda
No episódio 87 do The Artificial Intelligence Show, Roetzer previu que veríamos uma “explosão de robótica” entre 2026 e 2030.
Ele imaginou grandes investimentos em robôs humanóides de players como OpenAI, Tesla e Figure, juntamente com avanços tanto no hardware robótico quanto nos “cérebros”, ou modelos de IA multimodal.
A demonstração da robótica da Figure lançada esta semana se alinha perfeitamente com essa visão. A empresa construiu um robô humanóide impressionante e se associou à OpenAI para alimentá-lo com IA avançada. O resultado é um passo significativo em direção ao futuro dos robôs inteligentes que Roetzer vislumbra no horizonte.
Mas lembre-se, diz Roetzer, ainda é muito cedo.
A demonstração da Figure usando os modelos da OpenAI é incrivelmente impressionante. Mas isso não altera seu cronograma para a verdadeira explosão no desenvolvimento da robótica.
E a Figure não é a única participante neste espaço. Roetzer espera que a Tesla infunda seu robô Optimus com seu próprio modelo de linguagem, Grok, para citar apenas um dos prováveis pesos pesados da robótica.
Como a IA está conferindo “inteligência” aos robôs
O que é realmente revolucionário sobre a demonstração da Figure é a maneira como combina robótica de ponta com IA de última geração. Ao incorporar a IA multimodal da OpenAI em um robô físico, a Figure criou uma máquina capaz de entender e gerar linguagem, raciocinar, planejar e aprender.
Por exemplo, em um segmento do vídeo de demonstração, um humano simplesmente diz ao robô “estou com fome”. O robô consegue deduzir que, dos objetos à sua frente, apenas uma maçã é comestível. Ele pega a maçã e a entrega à pessoa.
“Um robô não poderia fazer isso há um ou dois anos,” diz Roetzer. “O fato de agora poder ver coisas, entender coisas, é realmente o que está acontecendo aqui.”
Como funcionam os robôs inteligentes
Para uma análise mais técnica de como o sistema da Figure funciona, Roetzer aponta para uma excelente thread no X de Corey Lynch, engenheiro sênior de IA de manipulação da Figure.
Agora estamos tendo conversas completas com o Figure 01, graças à nossa parceria com a OpenAI.
Nosso robô pode:
– descrever sua experiência visual
– planejar ações futuras
– refletir sobre sua memória
– explicar seu raciocínio verbalmente
Análise técnica 🧵:pic.twitter.com/6QRzfkbxZY— Corey Lynch (@coreylynch) 13 de março de 2024
Alguns detalhes principais:
- Nenhuma teleoperação humana está envolvida no vídeo de demonstração.
- Imagens das câmeras do robô e falas de seus microfones são alimentadas em um modelo de IA multimodal treinado pela OpenAI.
- A IA processa as imagens e o histórico de conversação para gerar respostas em linguagem, que são faladas de volta ao humano. Ela também é responsável por decidir quais comportamentos aprendidos o robô deve executar para cumprir comandos.
- O robô pode descrever sua experiência visual, planejar ações futuras, refletir sobre sua memória e explicar seu raciocínio verbalmente.
O futuro está chegando rápido
Embora a demonstração da Figure não mude o cronograma de Roetzer de 2026 a 2030, ele acredita que é uma demonstração poderosa do ritmo exponencial de progresso tecnológico em IA e robótica—uma demonstração que devemos levar a sério.
“Eu converso com pessoas o tempo todo que acham que as coisas estão a décadas de distância,” diz Roetzer. “O que eu digo às pessoas é que você não pode afirmar que algo está a décadas de distância agora, porque não compreendemos como é uma curva de crescimento exponencial.”
Conteúdo relacionado
40% das Compras Pmax de uma Marca de E-commerce Foram Exibidas em Sites MFA Criados por IA e Domínios Inativos
[the_ad id="145565"] A crescente presença de sites gerados por inteligência artificial voltados para a publicidade está dificultando a tarefa dos anunciantes em garantir que…
Como o Anúncio de Fim de Ano da Coca-Cola com IA Passou de Elogios a Raiva
[the_ad id="145565"] Inicialmente, o remake da Coca-Cola de seu comercial de 1995, “As Férias Estão Chegando,” alimentado por IA, parecia ser bem recebido. A System1, que testa…
Dentro da Estratégia de Dados Focada no Cliente de Chris Marino no Google
[the_ad id="145565"] No episódio deste podcast The Speed of Culture, o fundador e apresentador da Suzy, Matt Britton, conversa com Chris Marino, chefe de agência da Google…