Bolt42

Bhavish Aggarwal, fundador da Ola, está investindo US$ 230 milhões em uma startup de IA que ele fundou, enquanto o país se esforça para se firmar em um campo dominado por empresas dos EUA e da China.

Aggarwal está financiando o investimento na Krutrim em grande parte através de seu escritório familiar, disse uma fonte familiarizada com o assunto ao TechCrunch. Em uma postagem no X na terça-feira, Aggarwal afirmou que a Krutrim busca atrair um investimento de US$ 1,15 bilhão até o próximo ano. Ele buscará arrecadar o restante do capital de investidores externos, disse a fonte.

O anúncio de financiamento coincide com a startup unicórnio Krutrim tornando seus modelos de IA de código aberto e revelando planos para construir o que afirma ser o maior supercomputador da Índia em parceria com a Nvidia.

O laboratório lançou o Krutrim-2, um modelo de linguagem com 12 bilhões de parâmetros que demonstrou bom desempenho no processamento de idiomas indianos. Em testes de análise de sentimentos, a Krutrim compartilhou na terça-feira que obteve 0,95 em comparação com 0,70 para modelos concorrentes, além de alcançar uma taxa de sucesso de 80% em tarefas de geração de código.

O laboratório também disponibilizou vários modelos especializados de código aberto, incluindo sistemas para processamento de imagens, tradução de fala e busca de texto, todos otimizados para idiomas indianos.

“Ainda estamos longe dos benchmarks globais, mas fizemos bons progressos em um ano”, escreveu Aggarwal, cujas outras empreitadas foram apoiadas pela SoftBank, no X. “Ao tornarmos nossos modelos de código aberto, esperamos que toda a comunidade de IA da Índia colabore para criar um ecossistema de IA indiano de classe mundial.”

A iniciativa surge enquanto a Índia busca se estabelecer em um cenário de inteligência artificial dominado por empresas dos EUA e da China. O recente lançamento do modelo de “raciocínio” R1 da DeepSeek, desenvolvido com um orçamento supostamente modesto, provocou agitação na indústria de tecnologia.

Na semana passada, a Índia elogiou o progresso da DeepSeek e declarou que o país hospedará os modelos de linguagem da grande laboratório de IA chinês em servidores domésticos. O braço em nuvem da Krutrim começou a oferecer a DeepSeek em servidores indianos na semana passada.

A Krutrim também desenvolveu sua própria estrutura de avaliação, BharatBench, para avaliar a proficiência de modelos de IA em idiomas indianos, abordando uma lacuna em benchmarks existentes que se concentram principalmente em inglês e chinês.

A abordagem técnica do laboratório inclui o uso de uma janela de contexto de 128.000 tokens, permitindo que seus sistemas lidem com textos mais longos e conversas mais complexas. Métricas de desempenho publicadas pela startup mostraram que o Krutrim-2 obteve pontuações altas em correção gramatical (0,98) e conversas de múltiplas interações (0,91).

O investimento segue o lançamento em janeiro do Krutrim-1, um sistema com 7 bilhões de parâmetros que serviu como o primeiro modelo de linguagem de grande escala da Índia. A implantação do supercomputador com a Nvidia está programada para ser ativada em março, com expansão planejada ao longo do ano.


    16 − 15 =

    Bolt42