Bolt42

Como é possível discernir um modelo de linguagem de inteligência artificial confiável de um que não é? A OpenAI espera resolver esse problema ao introduzir o Programa Pioneiros da OpenAI.

A empresa afirmou que o programa foi projetado com a intenção de mostrar como é um bom modelo de linguagem, ajudando os usuários a otimizar o desempenho do modelo dentro de seus domínios.

“A criação de avaliações específicas de domínio é uma maneira de refletir melhor os casos de uso do mundo real, ajudando as equipes a avaliar o desempenho do modelo em ambientes práticos e de alto risco”, escreveu a empresa em um postagem no blog.

A OpenAI focou em indústrias como legal, finanças, seguros, saúde e contabilidade, entre outras, que necessitam de avaliações específicas de domínio adequadas.

“Nossa equipe trabalhará intensivamente com cada empresa para projetar avaliações adaptadas ao seu domínio—estabelecendo benchmarks claros que guiem o desenvolvimento do modelo e melhorem a confiança nos sistemas de IA, e compartilhando-os publicamente”, acrescentou a OpenAI.

A OpenAI informou que os resultados dessas avaliações específicas da indústria serão publicados em uma data posterior.

Bolt42