OpenAI Introduz Novo Programa Voltado para Avaliação de Marcos em Inteligência Artificial Específicos por Domínio

Como é possível discernir um modelo de linguagem de inteligência artificial confiável de um que não é? A OpenAI espera resolver esse problema ao introduzir o Programa Pioneiros da OpenAI.

A empresa afirmou que o programa foi projetado com a intenção de mostrar como é um bom modelo de linguagem, ajudando os usuários a otimizar o desempenho do modelo dentro de seus domínios.

“A criação de avaliações específicas de domínio é uma maneira de refletir melhor os casos de uso do mundo real, ajudando as equipes a avaliar o desempenho do modelo em ambientes práticos e de alto risco”, escreveu a empresa em um postagem no blog.

A OpenAI focou em indústrias como legal, finanças, seguros, saúde e contabilidade, entre outras, que necessitam de avaliações específicas de domínio adequadas.

“Nossa equipe trabalhará intensivamente com cada empresa para projetar avaliações adaptadas ao seu domínio—estabelecendo benchmarks claros que guiem o desenvolvimento do modelo e melhorem a confiança nos sistemas de IA, e compartilhando-os publicamente”, acrescentou a OpenAI.

A OpenAI informou que os resultados dessas avaliações específicas da indústria serão publicados em uma data posterior.

Conteúdo relacionado

Marketing & IA

OpenAI Introduz Novo Programa Voltado para Avaliação de Marcos em Inteligência Artificial Específicos por Domínio

Conteúdo relacionado

Zoom contrata Kimberly Storin como CMO

Seu Público Não Precisa Mais de Você

As Tarifas de Trump Farão os Custos de IA Dispararem, Mas a Adoção Não Irá Diminuir