Inscreva-se em nossos boletins diários e semanais para as últimas atualizações e conteúdos exclusivos sobre cobertura líder da indústria em IA. Saiba Mais
Hugging Face e Physical Intelligence lançaram discretamente Pi0 (Pi-Zero) esta semana, o primeiro modelo fundamental para robôs que traduz comandos de linguagem natural diretamente em ações físicas.
“Pi0 é o modelo de ação de linguagem de visão mais avançado,” anunciou Remi Cadene, um cientista principal de pesquisa da Hugging Face, em um post no X que rapidamente ganhou atenção na comunidade de IA. “Ele recebe comandos de linguagem natural como entrada e produz comportamento autônomo diretamente.”
Este lançamento marca um momento crucial na robótica: a primeira vez que um modelo fundamental para robôs foi amplamente disponibilizado através de uma plataforma de código aberto. Assim como o ChatGPT revolucionou a geração de texto, o Pi0 visa transformar a forma como os robôs aprendem e executam tarefas.
O futuro da robótica é aberto!
Estou empolgado em ver o Pi0 da @physical_int sendo o primeiro modelo de robótica fundamental a ser disponibilizado como código aberto na @huggingface @LeRobotHF. Você agora pode afiná-lo em seu próprio conjunto de dados.
??? pic.twitter.com/ar8SHgyFbv
— clem ? (@ClementDelangue) 4 de fevereiro de 2025
Como o Pi0 traz aprendizado no estilo ChatGPT para a robótica, desbloqueando tarefas complexas
O modelo, originalmente desenvolvido pela Physical Intelligence e agora portado para a plataforma LeRobot da Hugging Face, pode realizar tarefas complexas como dobrar roupas, limpar mesas e embalar compras — atividades que sempre foram extremamente desafiadoras para os robôs dominarem.
“Os robôs de hoje são especialistas limitados, programados para movimentos repetitivos em configurações coreografadas,” escreveu a equipe de pesquisa da Physical Intelligence em sua postagem de anúncio. “O Pi0 muda isso, permitindo que os robôs aprendam e sigam instruções do usuário, tornando a programação tão simples quanto dizer ao robô o que você quer que seja feito.”
A tecnologia por trás do Pi0 representa uma conquista técnica significativa. O modelo foi treinado com dados de sete plataformas robóticas diferentes e 68 tarefas únicas, permitindo que ele lidasse com tudo, desde tarefas de manipulação delicada até procedimentos complexos de múltiplos passos. Ele utiliza uma técnica nova chamada correspondência de fluxo para produzir trajetórias de ação suaves em tempo real a 50Hz, tornando-o altamente preciso e adaptável para implantação no mundo real.
Nova tecnologia FAST acelera o treinamento de robôs em 5X, expandindo o potencial da IA
Construindo sobre essa base, a equipe também introduziu “Pi0-FAST,” uma versão aprimorada do modelo que incorpora um novo esquema de tokenização chamado tokenização de sequência de ação no espaço de frequência (FAST). Esta versão treina cinco vezes mais rápido que seu predecessor e mostra melhor generalização em diferentes ambientes e tipos de robôs.
As implicações para a indústria são substanciais. Fábricas de manufatura poderiam potencialmente reprogramar robôs para novas tarefas por meio de instruções verbais simples, em vez de codificação complexa. Armazéns poderiam implantar sistemas de automação mais flexíveis que se adaptam às necessidades em mudança. Até mesmo pequenas empresas poderiam encontrar a robótica mais acessível, pois a barreira para programação e implantação diminui significativamente.
No entanto, desafios permanecem. Embora o Pi0 represente um avanço significativo, ainda tem limitações. O modelo ocasionalmente enfrenta dificuldades com tarefas muito complexas e requer recursos computacionais substanciais. Também há questões sobre confiabilidade e segurança em ambientes industriais.
O lançamento ocorre em um momento crucial na evolução da indústria de IA. À medida que as empresas correm para desenvolver e implantar inteligência artificial geral (AGI), o Pi0 representa uma das primeiras tentativas bem-sucedidas de preencher a lacuna entre modelos de linguagem e interação no mundo físico.
A tecnologia agora está disponível através da plataforma Hugging Face, onde os desenvolvedores podem baixar e usar a política pré-treinada com apenas algumas linhas de código:
pythonRunCopy
policy = Pi0Policy.from_pretrained("lerobot/pi0")
Para usuários corporativos, essa acessibilidade poderia acelerar a adoção de robótica avançada em várias indústrias. As empresas podem agora ajustar o modelo para casos de uso específicos, potencialmente reduzindo o tempo e o custo associados à implementação de soluções robóticas.
Por que os líderes empresariais devem dar atenção à robótica de código aberto
A equipe de desenvolvimento também lançou documentação abrangente e materiais de treinamento, tornando a tecnologia acessível a uma gama mais ampla de usuários. Esta democratização da tecnologia robótica pode levar a aplicações inovadoras em vários setores, desde saúde até varejo.
À medida que a tecnologia amadurece, pode redefinir nossa maneira de pensar sobre automação e interação humano-robô. A capacidade de controlar robôs através de linguagem natural pode tornar a assistência robótica mais acessível em lares, hospitais e pequenas empresas — áreas onde a robótica tradicional teve dificuldade para ganhar espaço devido à complexidade da programação.
Com este lançamento, o futuro da robótica parece cada vez mais conversa, adaptável e acessível. Embora ainda haja trabalho a ser feito, o Pi0 representa um passo significativo em direção à criação de robôs versáteis e inteligentes como uma realidade prática, e não uma fantasia de ficção científica.
Insights diários sobre casos de uso de negócios com VB Daily
Se você quer impressionar seu chefe, o VB Daily tem tudo o que você precisa. Nós trazemos para você as últimas informações sobre o que as empresas estão fazendo com IA generativa, desde mudanças regulatorias até implementações práticas, para que você possa compartilhar insights para um ROI máximo.
Leia nossa Política de Privacidade
Obrigado por se inscrever. Confira mais boletins do VB aqui.
Ocorreu um erro.

Conteúdo relacionado
Anthropic transforma a abordagem da IA na educação: o Modo de Aprendizagem do Claude faz os alunos refletirem.
[the_ad id="145565"] Junte-se aos nossos boletins diários e semanais para as últimas novidades e conteúdo exclusivo sobre cobertura de IA de liderança no setor. Saiba mais……
Anthropic lança um plano de chatbot de IA para faculdades e universidades
[the_ad id="145565"] A Anthropic anunciou na quarta-feira que está lançando uma nova camada Claude para Educação, como resposta ao plano ChatGPT Edu da OpenAI. A nova camada é…
O artigo de 145 páginas da DeepMind sobre segurança em AGI pode não convencer os céticos.
[the_ad id="145565"] O Google DeepMind publicou na quarta-feira um documento exaustivo sobre sua abordagem de segurança para AGI, definida de forma ampla como uma IA capaz de…