Bolt42

Está se tornando um pouco mais fácil criar projetos sofisticados de robótica em casa.

No início desta semana, a plataforma de desenvolvimento de IA Hugging Face lançou um modelo de IA aberto para robótica chamado SmolVLA. Treinado em conjuntos de dados compartilhados pela comunidade com licenciamento compatível, o SmolVLA supera modelos muito maiores para robótica em ambientes virtuais e no mundo real, segundo afirma a Hugging Face.

“O SmolVLA tem como objetivo democratizar o acesso a modelos de visão-linguagem-ação [VLA] e acelerar a pesquisa em direção a agentes robóticos generalistas,” escreve a Hugging Face em uma publicação no blog. “O SmolVLA não é apenas um modelo leve, mas também um método para treinar e avaliar tecnologias robóticas generalistas.”

O SmolVLA faz parte do esforço em rápida expansão da Hugging Face para estabelecer um ecossistema de hardware e software de robótica de baixo custo. No ano passado, a empresa lançou o LeRobot, uma coleção de modelos, conjuntos de dados e ferramentas focadas em robótica. Mais recentemente, a Hugging Face adquiriu a Pollen Robotics, uma startup de robótica baseada na França, e apresentou vários sistemas robóticos acessíveis, incluindo humanoides, para compra.

Com 450 milhões de parâmetros, o SmolVLA foi treinado com dados dos Conjuntos de Dados da Comunidade LeRobot, que são conjuntos de dados de robótica especialmente marcados e compartilhados na plataforma de desenvolvimento de IA da Hugging Face. Parâmetros, às vezes referidos como “pesos”, são os componentes internos de um modelo que guiam seu comportamento.

A Hugging Face afirma que o SmolVLA é pequeno o suficiente para rodar em uma única GPU de consumidor — ou até mesmo em um MacBook — e pode ser testado e implantado em hardware “acessível”, incluindo os próprios sistemas robóticos da empresa.

De forma interessante, o SmolVLA também suporta um “stack de inferência assíncrona”, que permite ao modelo separar o processamento das ações de um robô do processamento do que ele vê e ouve. Como a empresa explica em sua publicação no blog, “[b] Devido a essa separação, os robôs podem responder mais rapidamente em ambientes que mudam rapidamente.”

O SmolVLA está disponível para download na Hugging Face. Já, um usuário no X afirma ter utilizado o modelo para controlar um braço robótico de terceiros:

Vale notar que a Hugging Face está longe de ser o único jogador na corrida emergente de robótica aberta.

A Nvidia possui uma coleção de ferramentas para robótica aberta, e a startup K-Scale Labs está construindo os componentes do que chama de “humanoides de código aberto.” Outras empresas notáveis no segmento incluem Dyna Robotics, Physical Intelligence, apoiada por Jeff Bezos, e RLWRLD.


    quinze − 6 =

    Bolt42