Bolt42

A JetBrains, a empresa por trás de uma variedade de ferramentas populares para desenvolvimento de aplicativos, lançou seu primeiro modelo de IA “aberto” para codificação.

Na quarta-feira, a JetBrains tornou o Mellum, um modelo gerador de código que a empresa lançou para suas diversas suítes de desenvolvimento de software no ano passado, disponível abertamente na plataforma de desenvolvimento de IA Hugging Face. O Mellum, treinado com mais de 4 trilhões de tokens, apresenta 4 bilhões de parâmetros e é projetado especificamente para a conclusão de código (ou seja, completar trechos de código com base no contexto circundante).

Os parâmetros correspondem grosso modo às habilidades de resolução de problemas de um modelo, enquanto os tokens são as partes brutas de dados que o modelo processa. Um milhão de tokens é equivalente a cerca de 30.000 linhas de código.

“Projetado para integração em ferramentas profissionais de desenvolvimento (por exemplo, sugestões de código inteligentes em ambientes integrados de desenvolvimento), assistentes de codificação alimentados por IA e pesquisas sobre compreensão e geração de código, o Mellum também é bem adequado para aplicações educacionais e experimentos de ajuste fino,” explica a JetBrains em um relatório técnico.

A JetBrains afirma que treinou o Mellum, que possui licença Apache 2.0, utilizando uma coleção de conjuntos de dados, incluindo código licenciado permissivamente do GitHub e artigos da Wikipedia em inglês. O treinamento levou cerca de 20 dias em um cluster de 256 GPUs Nvidia H200.

Configurar o Mellum requer algum esforço. O modelo base não pode ser usado diretamente; ele precisa ser ajustado primeiro. Embora a JetBrains tenha fornecido alguns modelos do Mellum ajustados para Python, a empresa alerta que eles devem ser considerados para “estimação de capacidades potenciais” — não para implantação em um ambiente de produção.

O código gerado por IA está, sem dúvida, mudando a forma como o software é construído, mas também está introduzindo novos desafios de segurança. Mais de 50% das organizações encontram problemas de segurança com código produzido por IA às vezes ou frequentemente, de acordo com uma pesquisa de 2023 da plataforma de segurança para desenvolvedores Snyk.

Evento Techcrunch

Berkeley, CA
|
5 de junho

RESERVE AGORA

De fato, a JetBrains observa que o Mellum pode “refletir preconceitos presentes em bases de código públicas” (por exemplo, gerando código semelhante em estilo a repositórios de código aberto) e que suas sugestões de código não serão necessariamente “seguros ou livres de vulnerabilidades.”

“Isso é apenas o começo,” escreveu a JetBrains em um postagem de blog. “Não estamos buscando a generalidade — estamos construindo foco. Se o Mellum provocar ao menos um experimento, contribuição ou colaboração significativa, consideraremos isso uma vitória.”


    20 − nove =

    Bolt42