Como é possível discernir um modelo de linguagem de inteligência artificial confiável de um que não é? A OpenAI espera resolver esse problema ao introduzir o Programa Pioneiros da OpenAI.
A empresa afirmou que o programa foi projetado com a intenção de mostrar como é um bom modelo de linguagem, ajudando os usuários a otimizar o desempenho do modelo dentro de seus domínios.
“A criação de avaliações específicas de domínio é uma maneira de refletir melhor os casos de uso do mundo real, ajudando as equipes a avaliar o desempenho do modelo em ambientes práticos e de alto risco”, escreveu a empresa em um postagem no blog.
A OpenAI focou em indústrias como legal, finanças, seguros, saúde e contabilidade, entre outras, que necessitam de avaliações específicas de domínio adequadas.
“Nossa equipe trabalhará intensivamente com cada empresa para projetar avaliações adaptadas ao seu domínio—estabelecendo benchmarks claros que guiem o desenvolvimento do modelo e melhorem a confiança nos sistemas de IA, e compartilhando-os publicamente”, acrescentou a OpenAI.
A OpenAI informou que os resultados dessas avaliações específicas da indústria serão publicados em uma data posterior.
Conteúdo relacionado
Zoom contrata Kimberly Storin como CMO
[the_ad id="145565"] A Zoom contratou Kimberly Storin como sua nova diretora de marketing (CMO). A executiva vem da Zayo Group, um provedor de comunicações e infraestrutura de…
Seu Público Não Precisa Mais de Você
[the_ad id="145565"] “Por que sua audiência precisa da sua marca?” Essa foi a pergunta que um executivo veterano me fez quando me tornei editor-chefe. É a mesma que editores…
As Tarifas de Trump Farão os Custos de IA Dispararem, Mas a Adoção Não Irá Diminuir
[the_ad id="145565"] Como os mercados globais abalados podem atestar, as tarifas do presidente Trump têm implicações de longo alcance, e a indústria de IA não é diferente.…