Galileo lança 'Avaliações Agenticas' para corrigir erros de agentes de IA antes que custem a você.

Junte-se aos nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre cobertura de IA de ponta. Saiba mais

Galileo, uma startup baseada em São Francisco, acredita que o futuro da inteligência artificial depende da confiança. Hoje, a empresa lançou um novo produto, Avaliações Agentic, para enfrentar um desafio crescente no mundo da IA: garantir que os sistemas complexos conhecidos como agentes de IA realmente funcionem como pretendido.

Agentes de IA — sistemas autônomos que realizam tarefas em múltiplas etapas, como geração de relatórios ou análise de dados de clientes — estão ganhando espaço em diversas indústrias. Porém, sua rápida adoção levanta uma questão crucial: como as empresas podem verificar se esses sistemas permanecem confiáveis após a implementação? O CEO da Galileo, Vikram Chatterji, acredita que sua empresa encontrou a resposta.

“Nos últimos seis a oito meses, começamos a ver alguns de nossos clientes tentando adotar sistemas agentic,” disse Chatterji em uma entrevista. “Agora, LLMs podem ser usados como um roteador inteligente para escolher as chamadas de API certas para realmente completar uma tarefa. Passar de apenas gerar texto para realmente completar uma tarefa foi um grande abismo que foi desbloqueado.”

Um diagrama mostrando como a Galileo avalia agentes de IA em três etapas-chave: seleção de ferramentas, detecção de erros e conclusão de tarefas. (Crédito: Galileo)

Agentes de IA mostram potencial, mas as empresas exigem responsabilidade

Grandes empresas como Cisco e Ema (fundada pelo ex-Chief Product Officer da Coinbase) já adotaram a plataforma da Galileo. Essas empresas usam agentes de IA para automatizar tarefas desde suporte ao cliente até análise financeira, reportando ganhos significativos de produtividade.

“Um representante de vendas que tenta fazer prospecção normalmente gastaria talvez uma semana para fazer isso, enquanto com alguns desses agentes habilitados por IA, eles estão fazendo isso em dois dias ou menos,” explicou Chatterji, ressaltando o retorno sobre o investimento para as empresas.

O novo framework da Galileo avalia a qualidade da seleção de ferramentas, detecta erros nas chamadas de ferramentas e rastreia o sucesso geral das sessões. Ele também monitora métricas essenciais para a implantação em grande escala de IA, incluindo custos e latência.

Um painel mostrando como a Galileo avalia agentes de IA em três etapas-chave: seleção de ferramentas, detecção de erros e conclusão de tarefas. (Crédito: Galileo)

$68 milhões em financiamento impulsionam a investida da Galileo em IA empresarial

O lançamento se baseia no recente impulso da Galileo. A empresa levantou $45 milhões em uma rodada de financiamento Série B liderada pela Scale Venture Partners em outubro passado, totalizando $68 milhões de financiamento. Analistas da indústria projetam que o mercado de ferramentas para operações de IA pode alcançar $4 bilhões até 2025.

Os riscos são altos à medida que a implantação de IA acelera. Estudos mostram que até mesmo modelos avançados como o GPT-4 podem alucinar cerca de 23% das vezes durante tarefas básicas de perguntas e respostas. As ferramentas da Galileo ajudam as empresas a identificar esses problemas antes que impactem as operações.

“Antes de lançar isso, realmente precisamos saber que funciona,” disse Chatterji, descrevendo as preocupações dos clientes. “A barra é realmente alta. Então, é aí que proporcionamos essa cadeia de ferramentas, de modo que eles possam usar nossas métricas como base para esses testes.”

Abordando alucinações de IA e desafios em escala empresarial

O foco da empresa em soluções confiáveis e prontas para produção a posiciona bem em um mercado cada vez mais preocupado com a segurança da IA. Para líderes técnicos que implementam IA empresarial, a plataforma da Galileo oferece salvaguardas essenciais para garantir que os agentes de IA operem conforme o pretendido, ao mesmo tempo em que controlam os custos.

À medida que as empresas expandem o uso de agentes de IA, ferramentas de monitoramento de desempenho tornam-se uma infraestrutura crucial. A mais recente oferta da Galileo visa ajudar as empresas a implantar IA de forma responsável e eficaz em grande escala.

“2025 será o ano dos agentes. Vai ser muito prolífico,” observou Chatterji. “No entanto, o que também vimos é que muitas empresas estão apenas lançando esses agentes sem uma boa testagem, o que leva a implicações negativas… A necessidade de testes e avaliações adequados é maior do que nunca.”

Insights diários sobre casos de uso empresarial com o VB Daily

Se você quer impressionar seu chefe, o VB Daily tem tudo o que você precisa. Nós trazemos informações sobre o que as empresas estão fazendo com IA generativa, desde mudanças regulatórias até implantações práticas, para que você possa compartilhar insights para um ROI máximo.

Leia nossa Política de Privacidade

Obrigado por se inscrever. Confira mais newsletters do VB aqui.

Ocorreu um erro.

Conteúdo relacionado

BusinessInteligência artificial

Galileo lança 'Avaliações Agenticas' para corrigir erros de agentes de IA antes que custem a você.

Agentes de IA mostram potencial, mas as empresas exigem responsabilidade

$68 milhões em financiamento impulsionam a investida da Galileo em IA empresarial

Abordando alucinações de IA e desafios em escala empresarial

Conteúdo relacionado

Pesquisador de IA renomado lança startup polêmica para substituir todos os trabalhadores humanos em todos os lugares

ChatGPT se refere a usuários pelo nome sem solicitação, e alguns acham isso ‘estranho’

De ‘acompanhar’ a ‘nos acompanhar’: Como o Google silenciosamente assumiu a liderança em IA empresarial.