Está se tornando um pouco mais fácil criar projetos sofisticados de robótica em casa.
No início desta semana, a plataforma de desenvolvimento de IA Hugging Face lançou um modelo de IA aberto para robótica chamado SmolVLA. Treinado em conjuntos de dados compartilhados pela comunidade com licenciamento compatível, o SmolVLA supera modelos muito maiores para robótica em ambientes virtuais e no mundo real, segundo afirma a Hugging Face.
“O SmolVLA tem como objetivo democratizar o acesso a modelos de visão-linguagem-ação [VLA] e acelerar a pesquisa em direção a agentes robóticos generalistas,” escreve a Hugging Face em uma publicação no blog. “O SmolVLA não é apenas um modelo leve, mas também um método para treinar e avaliar tecnologias robóticas generalistas.”
O SmolVLA faz parte do esforço em rápida expansão da Hugging Face para estabelecer um ecossistema de hardware e software de robótica de baixo custo. No ano passado, a empresa lançou o LeRobot, uma coleção de modelos, conjuntos de dados e ferramentas focadas em robótica. Mais recentemente, a Hugging Face adquiriu a Pollen Robotics, uma startup de robótica baseada na França, e apresentou vários sistemas robóticos acessíveis, incluindo humanoides, para compra.
Com 450 milhões de parâmetros, o SmolVLA foi treinado com dados dos Conjuntos de Dados da Comunidade LeRobot, que são conjuntos de dados de robótica especialmente marcados e compartilhados na plataforma de desenvolvimento de IA da Hugging Face. Parâmetros, às vezes referidos como “pesos”, são os componentes internos de um modelo que guiam seu comportamento.
A Hugging Face afirma que o SmolVLA é pequeno o suficiente para rodar em uma única GPU de consumidor — ou até mesmo em um MacBook — e pode ser testado e implantado em hardware “acessível”, incluindo os próprios sistemas robóticos da empresa.
De forma interessante, o SmolVLA também suporta um “stack de inferência assíncrona”, que permite ao modelo separar o processamento das ações de um robô do processamento do que ele vê e ouve. Como a empresa explica em sua publicação no blog, “[b] Devido a essa separação, os robôs podem responder mais rapidamente em ambientes que mudam rapidamente.”
O SmolVLA está disponível para download na Hugging Face. Já, um usuário no X afirma ter utilizado o modelo para controlar um braço robótico de terceiros:
🚀 SmolVLA — parece um momento BERT para a robótica 🤖
Eu testei no Koch Arm:
Inferência em RTX 2050 (4GB), ajustado com apenas 31 demonstrações, e iguala/supera as linhas de base de tarefa única 🔥Grande obrigado a @RemiCadene @danaubakirova @mustash97 @francesco__capu 🙌 pic.twitter.com/TiBkAZGwkM
— Xingdong Zuo (@XingdongZ) 4 de junho de 2025
Vale notar que a Hugging Face está longe de ser o único jogador na corrida emergente de robótica aberta.
A Nvidia possui uma coleção de ferramentas para robótica aberta, e a startup K-Scale Labs está construindo os componentes do que chama de “humanoides de código aberto.” Outras empresas notáveis no segmento incluem Dyna Robotics, Physical Intelligence, apoiada por Jeff Bezos, e RLWRLD.
Conteúdo relacionado
A Amazon lança novo grupo de P&D focado em IA agentiva e robótica.
[the_ad id="145565"] A gigante da tecnologia Amazon planeja lançar um novo grupo dentro de sua divisão de produtos de consumo que se concentrará em IA agentiva. A Amazon…
Perplexity recebeu 780 milhões de consultas no mês passado, diz CEO.
[the_ad id="145565"] Perplexity recebeu 780 milhões de consultas em maio, compartilhou o CEO Aravind Srinivas no palco da Cúpula de Tecnologia da Bloomberg na quinta-feira.…
A Anysphere da Cursor atinge uma avaliação de $9,9 bilhões e supera $500 milhões em ARR.
[the_ad id="145565"] A Anysphere, fabricante do assistente de codificação AI Cursor, arrecadou US$ 900 milhões com uma avaliação de US$ 9,9 bilhões, reportou a Bloomberg. A…