Participe de nossas newsletters diárias e semanais para obter as últimas atualizações e conteúdo exclusivo sobre cobertura de IA de ponta. Saiba Mais
Isenção de responsabilidade: A EndlessAI publicou anteriormente um artigo de colaborador no VentureBeat anunciando o lançamento do Lloyd no início de outubro.
A startup de IA de quatro anos, EndlessAI, ainda não é um nome conhecido — mas.
Contudo, seus fundadores e líderes acreditam que têm um verdadeiro sucesso em mãos: seu aplicativo Lloyd, que utiliza tecnologia de streaming e codificação de vídeo proprietária para alimentar a visualização de vídeo ao vivo do usuário para modelos de IA subjacentes, incluindo o GPT-4, para ajudar em uma ampla variedade de tarefas, desde consertar bicicletas até contar histórias para dormir, já alcançou mais de 50.000 usuários três meses após um lançamento discreto.
41% desses usuários interagem com o aplicativo diariamente, de acordo com dados fornecidos ao VentureBeat pela EndlessAI.
Embora não seja um ChatGPT — que se tornou o produto de crescimento mais rápido da história a ultrapassar a marca de 100 milhões de usuários em janeiro de 2023, apenas dois meses após o lançamento — isso é, no entanto, encorajador o suficiente para o CEO da EndlessAI, Roi Ginat, e o Presidente Executivo, Thomas Pompidou, que disseram ao VentureBeat em uma recente entrevista por vídeo que planejam abrir sua plataforma para desenvolvedores de terceiros no início de 2025 e lançar um aplicativo Android voltado para o consumidor em janeiro.
Além disso, a EndlessAI já começou a atualizar o Lloyd com o que chama de “poderes”, ou como Pompidou descreve, “basicamente, modelos de linguagem de longa escala (LLMs) ajustados que oferecem uma análise aprofundada para o consumidor em casos de uso específicos.”
Por exemplo, o primeiro Poder Lloyd ao vivo agora no aplicativo é “Chef”, que fornece um treinador de IA em tempo real que observa você enquanto você cozinha (se você apontar a câmera do smartphone para o fogão ou área de cozimento) e fornece orientações passo a passo.
Outro Poder Lloyd planejado para ser lançando em breve é o Guia Turístico, que permite que os usuários segurem seu telefone e vejam informações contextuais em tempo real sobre o que está ao seu redor. Ao capturar um vídeo de uma localização, ele identifica pontos de interesse, fornece detalhes relevantes e pode até recomendar atrações ou atividades próximas.
Facilitando a análise de vídeo em tempo real em grande escala
Embora os LLMs atuais tenham lutado para processar vídeo ao vivo de forma eficiente devido aos altos custos computacionais. A tecnologia da EndlessAI supera essa limitação, reduzindo o custo de análise de vídeo em mais de 99%.
Pompidou destacou a missão mais ampla do aplicativo: “Nossa missão é escalar a IA para o mundo real. O mundo real é visual e ao vivo, e os modelos de linguagem de grande escala de hoje, como estão arquitetados, enfrentam desafios em analisar vídeo de forma precisa, em grande escala e de maneira econômica. É isso que tornamos possível.”
Isso permite a análise de vídeo em tempo real, permitindo que os usuários interajam com seu ambiente de maneiras inovadoras, desde diagnosticar problemas mecânicos até criar histórias personalizadas para dormir.
A principal diferenciação do Lloyd está em sua capacidade de processar dados de vídeo através de LLMs a uma fração do custo normalmente associado a essas tarefas. As arquiteturas tradicionais de LLM não são otimizadas para vídeo, tornando a análise de vídeo em tempo real proibitivamente cara e lenta.
“Analisar vídeo com ChatGPT, assumindo que pudesse, custaria mais de $300 por hora,” disse Pompidou. “Com o Lloyd, oferecemos o mesmo nível de precisão por apenas alguns centavos por hora.”
Essa eficiência de custo é alcançada sem sacrificar a precisão, diferenciando Lloyd dos concorrentes que dependem de taxas de quadros reduzidas ou resoluções mais baixas para cortar custos, muitas vezes às custas da confiabilidade.
“Nossa camada de comunicação é robusta de maneiras que outras soluções não são. Ela permite que os desenvolvedores integrem serviços de IA em tempo real, como conversão de fala em texto, síntese de fala e análise de vídeo com confiabilidade e desempenho incomparáveis.”
Enquanto Pompidou vislumbra o futuro, ele ofereceu um vislumbre do potencial do aplicativo: “Imagine um LLM ajustado que tenha sido treinado em todos os manuais de instrução da IKEA, guiando clientes passo a passo com vídeo e reconhecendo erros em tempo real. É apenas um exemplo de como nossa tecnologia pode transformar as experiências dos usuários.”
Outra grande área que a EndlessAI planeja explorar por meio do Lloyd e sua tecnologia de codificação de vídeo subjacente: aplicação da lei, especificamente fornecendo análise das filmagens de câmeras corporais da polícia.
“Se alguém tiver um ataque cardíaco, ele o reconhecerá e fornecerá ao policial instruções sobre o que fazer imediatamente,” disse Pompidou.
Privacidade e segurança
Embora o Lloyd veja exatamente o que você aponta a câmera do smartphone, a EndlessAI prioriza a privacidade do usuário.
“Os dados permanecem privados para [as] contas dos usuários, e só acessamos quando os usuários solicitam explicitamente assistência,” disse Ginat.
Essa abordagem garante proteções robustas, ao mesmo tempo em que permite interações contínuas.
Mas, como consequência, a EndlessAI não tem certeza do que são os usos mais populares do Lloyd entre seus usuários. Anecdoticamente, afirma que suas pesquisas e formulários de feedback mostraram interesse em preparação de alimentos, reparos em casa, moda e coaching de estilo de vida, entre outros.
Enquanto os recursos voltados para o consumidor do Lloyd ganham tração, a EndlessAI também está construindo ferramentas para capacitar desenvolvedores e empresas a aproveitar sua tecnologia.
“Nosso roteiro de longo prazo inclui um SDK para desenvolvedores, começando no início do próximo ano,” disse Pompidou. “Isso permitirá que eles criem soluções visuais de IA únicas com extrema simplicidade.”
O SDK permitirá que os desenvolvedores integrem capacidades de visão de IA em seus próprios aplicativos.
“A primeira oferta para desenvolvedores será uma plataforma robusta para comunicação API em tempo real, conectando-se ao OpenAI e outros backends,” Ginat disse ao VentureBeat. “Os desenvolvedores poderão escolher quais componentes desejam usar, como serviços de áudio ou conversão de fala em texto.”
As aplicações para essas ferramentas abrangem diversas indústrias, desde a criação de aplicativos de chat aprimorados com IA até a integração de análise de vídeo em linhas de produção e sistemas de monitoramento de segurança.
A EndlessAI visa oferecer soluções escaláveis que se adaptem a diferentes requisitos de desempenho e custo.
“Nossas ferramentas para desenvolvedores permitirão ajustes on-the-fly — escolher entre serviços de backend ou soluções leves e em dispositivo, dependendo do caso de uso e requisitos de custo,” acrescentou Ginat.
Ao combinar APIs robustas com um SDK intuitivo, a EndlessAI vislumbra uma nova onda de aplicativos impulsionados por IA que vão além do processamento tradicional de texto ou imagem. “Vamos oferecer aos desenvolvedores a capacidade de integrar vários serviços, incluindo processamento lateral de vídeo, aprimorando suas sessões com capacidades adicionais,” disse Ginat.
Transformando a IA para consumidores e empresas
A capacidade do Lloyd de aproveitar smartphones existentes — sem exigir hardware adicional — torna-o excepcionalmente acessível.
Ao reduzir as barreiras de entrada, a EndlessAI está redefinindo o que é possível com IA na vida cotidiana e em indústrias especializadas.
Com sua rápida adoção de usuários, aplicações versáteis e um robusto roteiro, o Lloyd está preparado para se tornar uma inovação definidora no espaço da IA.
“Nossa estratégia de longo prazo é permanecer complementar aos LLMs,” disse Pompidou. “Mesmo quando os modelos puderem processar vídeo nativamente, pretendemos continuar sendo a camada de eficiência que torna essas aplicações viáveis e econômicas.”
VB Daily
Mantenha-se informado! Receba as últimas notícias em sua caixa de entrada diariamente
Ao se inscrever, você concorda com os Termos de Serviço do VentureBeat.
Obrigado por se inscrever. Confira mais newsletters do VB aqui.
Ocorreu um erro.
Conteúdo relacionado
Criações de IA editadas por humanos podem ser provavelmente protegidas por direitos autorais nos EUA, afirma agência
[the_ad id="145565"] Nos EUA, criações geradas por IA — livros, filmes e assim por diante — que foram editadas por um ser humano provavelmente podem ser protegidas por direitos…
Ai2 lança o Tülu 3, um modelo totalmente open-source que supera o DeepSeek v3 e o GPT-4o com uma nova abordagem de pós-treinamento.
[the_ad id="145565"] Participe de nossos boletins diários e semanais para as últimas atualizações e conteúdos exclusivos sobre cobertura de IA de liderança no setor. Saiba…
Microsoft lança Surface Pro e Laptop PCs com foco em Copilot, disponíveis com opções Snapdragon e Intel.
[the_ad id="145565"] Na quinta-feira, durante um evento em Nova York, a Microsoft apresentou duas novidades na linha de PCs Surface. O novo Surface Pro e o Surface Laptop…