Bolt42

Junte-se aos nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura de IA de liderança na indústria. Saiba mais


SambaNova e Hugging Face lançaram uma nova integração hoje que permite aos desenvolvedores implantar interfaces semelhantes ao ChatGPT com um único clique, reduzindo o tempo de implantação de horas para minutos.

Para os desenvolvedores que desejam experimentar o serviço, o processo é relativamente simples. Primeiro, visite o site de API da SambaNova Cloud e obtenha um token de acesso. Em seguida, utilizando Python, digite estas três linhas de código:

import gradio as gr
import sambanova_gradio
gr.load("Meta-Llama-3.1-70B-Instruct-8k", src=sambanova_gradio.registry, accept_token=True).launch()

O passo final é clicar em “Implantar no Hugging Face” e inserir o token da SambaNova. Em segundos, um chatbot de IA totalmente funcional fica disponível na plataforma Spaces do Hugging Face.

O código de três linhas necessário para implantar um chatbot de IA usando a integração nova da SambaNova e do Hugging Face. A interface inclui um botão “Implantar no Hugging Face”, demonstrando o processo de implantação simplificado. (Crédito: SambaNova / Hugging Face)

Como a implantação com um clique transforma o desenvolvimento de IA nas empresas

“Isso coloca um aplicativo em funcionamento em menos de um minuto, em comparação a codificar e implantar um aplicativo tradicional com um provedor de API, que pode levar uma hora ou mais, dependendo de problemas e de quão familiar você está com APIs, leitura de documentação, etc…”, disse Ahsen Khaliq, líder de Crescimento de ML da Gradio, em uma entrevista exclusiva ao VentureBeat.

A integração suporta chatbots somente de texto e multimodais, capazes de processar textos e imagens. Os desenvolvedores podem acessar modelos poderosos como o Llama 3.2-11B-Vision-Instruct através da plataforma de nuvem da SambaNova, com métricas de desempenho mostrando velocidades de processamento de até 358 tokens por segundo em hardware não restrito.

Métricas de desempenho revelam capacidades de nível empresarial

A implantação tradicional de chatbots geralmente requer amplo conhecimento de APIs, documentação e protocolos de implantação. O novo sistema simplifica esse processo para um único botão “Implantar no Hugging Face”, aumentando potencialmente a implantação de IA em organizações de diversas experiências técnicas.

“A SambaNova está comprometida em atender a comunidade de desenvolvedores e tornar a vida deles o mais fácil possível,” disse Kaizhao Liang, principal sênior de aprendizado de máquina da SambaNova Systems, ao VentureBeat. “Acesso rápido à inferência de IA não deve ter barreiras; a parceria com a Spaces do Hugging Face e o Gradio permite aos desenvolvedores utilizar inferência rápida na nuvem da SambaNova com uma experiência de implantação de aplicativo com um clique.”

As métricas de desempenho da integração, particularmente para o modelo Llama3 405B, demonstram capacidades significativas, com benchmarks mostrando um consumo de energia média de 8.411 KW para racks não restritos, sugerindo um desempenho robusto para aplicações em escala empresarial.

Métricas de desempenho para a implantação do modelo Llama3 405B da SambaNova, mostrando velocidades de processamento e consumo de energia em diferentes configurações de servidor. O rack não restrito demonstra capacidades de desempenho superiores, mas requer mais energia do que a configuração de 9KW. (Crédito: SambaNova)

Por que Esta Integração Pode Reformular a Adoção de IA nas Empresas

O lançamento desta integração coincide com a crescente demanda empresarial por soluções de IA que podem ser rapidamente implantadas e escaladas. Enquanto gigantes da tecnologia como OpenAI e Anthropic dominaram as manchetes com seus chatbots voltados para o consumidor, a abordagem da SambaNova mira diretamente a comunidade de desenvolvedores, fornecendo ferramentas de nível empresarial que correspondem à sofisticação das interfaces de IA líderes.

Para incentivar a adoção, a SambaNova e o Hugging Face realizarão um hackathon em dezembro, oferecendo aos desenvolvedores experiência prática com a nova integração. Esta iniciativa surge à medida que as empresas buscam cada vez mais maneiras de implementar soluções de IA sem a sobrecarga tradicional de longos ciclos de desenvolvimento.

Para os tomadores de decisão técnica, este desenvolvimento apresenta uma opção atraente para a rápida implantação de IA. O fluxo de trabalho simplificado pode potencialmente reduzir custos de desenvolvimento e acelerar o tempo de lançamento de recursos com IA, particularmente para organizações que buscam implementar interfaces conversacionais de IA.

No entanto, a implantação mais rápida traz novos desafios. As empresas devem pensar mais sobre como usar a IA de forma eficaz, quais problemas resolverão e como proteger a privacidade dos usuários e garantir o uso responsável. A simplicidade técnica não garante uma boa implementação.

“Estamos removendo a complexidade da implantação,” disse Liang ao VentureBeat, “para que os desenvolvedores possam se concentrar no que realmente importa: construir ferramentas que resolvam problemas reais.”

As ferramentas para construir chatbots de IA agora são simples o suficiente para quase qualquer desenvolvedor usar. Mas as questões mais difíceis permanecem exclusivamente humanas: O que devemos construir? Como vamos usá-lo? E, mais importante, isso realmente ajudará as pessoas? Esses são os desafios que valem a pena resolver.




    doze − 5 =




    Bolt42