A família de modelos de IA “abertos” da Google, Gemma, está se expandindo.
Durante Google I/O 2025 na terça-feira, a Google apresentou o Gemma 3n, um modelo projetado para funcionar “suavemente” em telefones, laptops e tablets. Disponível em prévia a partir de terça-feira, o Gemma 3n pode lidar com áudio, texto, imagens e vídeos, de acordo com a Google.
Modelos que são eficientes o suficiente para operar offline e sem necessidade de processamento na nuvem ganharam força na comunidade de IA nos últimos anos. Eles não apenas são mais baratos de usar do que grandes modelos, mas também preservam a privacidade ao eliminar a necessidade de transferir dados para um centro de dados remoto.
Durante uma apresentação no I/O, o Gerente de Produto do Gemma, Gus Martins, afirmou que o Gemma 3n pode rodar em dispositivos com menos de 2GB de RAM. “O Gemma 3n compartilha a mesma arquitetura que o Gemini Nano e é projetado para um desempenho incrível,” acrescentou.
Além do Gemma 3n, a Google está lançando o MedGemma através de seu programa Health AI Developer Foundations. Segundo a empresa, o MedGemma é seu modelo aberto mais capaz para analisar textos e imagens relacionados à saúde.
“MedGemma é nossa […] coleção de modelos abertos para compreensão multimodal de texto e imagem [da saúde],” disse Martins. “O MedGemma funciona bem em uma variedade de aplicações de imagem e texto, para que os desenvolvedores […] possam adaptar os modelos para seus próprios aplicativos de saúde.”
Também está a caminho o SignGemma, um modelo aberto para traduzir a linguagem de sinais em texto falado. A Google afirma que o SignGemma permitirá que os desenvolvedores criem novos aplicativos e integrações para usuários surdos e com dificuldade auditiva.
“SignGemma é uma nova família de modelos treinados para traduzir a linguagem de sinais em texto falado, mas é mais eficaz em Língua de Sinais Americana e Inglês,” disse Martins. “É o modelo de compreensão de linguagem de sinais mais competente já criado, e mal podemos esperar para que vocês — desenvolvedores e comunidades surdas e com dificuldade auditiva — utilizem esta base para construir.”
Vale destacar que o Gemma foi criticado por seus termos de licenciamento personalizados e não padronizados, que alguns desenvolvedores afirmam ter tornado o uso dos modelos comercialmente arriscado. No entanto, isso não desmotivou os desenvolvedores, que já baixaram os modelos Gemma várias dezenas de milhões de vezes coletivamente.
Atualizado às 14h40, horário do Pacífico: Adicionados vários comentários do Gerente de Produto do Gemma, Gus Martins.
Conteúdo relacionado
O Projeto Astra chega ao Google Search, Gemini e desenvolvedores.
[the_ad id="145565"] O Google anunciou na terça-feira, durante o Google I/O 2025, que o Projeto Astra — a experiência multimodal de IA de baixa latência da empresa — alimentará…
A plataforma de teleconferência 3D do Google, agora chamada Beam, será lançada no final de 2025.
[the_ad id="145565"] O Google anunciou na Google I/O 2025 que está rebatizando o Projeto Starline, sua plataforma de teleconferência focada em empresas que utiliza imagens 3D,…
Google revela novos recursos de IA que estão chegando ao Gmail, Docs e Vídeos.
[the_ad id="145565"] No Google I/O 2025, a empresa anunciou uma série de novos recursos de IA para o Workspace, que chegarão ao Gmail, Google Docs e Google Vids. O mais notável…