O Claude 3 Opus agora compete com o GPT-4 como o modelo de IA mais poderoso disponível.
Isso é de acordo com um importante ranking do LMSYS.org chamado Chatbot Arena. A Arena utiliza tanto crowdsourcing quanto classificações Elo para avaliar as capacidades dos modelos de IA.
(E é considerado uma fonte confiável por muitos especialistas da indústria.)
Até o momento da publicação, o Claude 3 Opus ocupa o primeiro lugar. Esses rankings estão sempre mudando e, em alguns momentos durante a redação, o Claude 3 Opus esteve em primeiro lugar sozinho ou empatado com o GPT-4.
O que isso significa para quem utiliza esses modelos nos negócios?
Mais importante ainda, como podemos acompanhar tudo isso?!
Consegui as respostas com o fundador/CEO do Marketing AI Institute, Paul Roetzer no Episode 90 do The Artificial Intelligence Show.
A conquista é impressionante…
Estamos satisfeitos com o desempenho do Claude 3 Opus em nossos experimentos. Ele rapidamente se tornou um modelo de referência para nosso trabalho.
Mas é apenas o mais recente vencedor em uma competição sempre dinâmica.
“É um campo que se move rapidamente,” diz Roetzer. “Acho que isso demonstra quão dinâmico é esse espaço.”
Recebemos novos modelos quase toda semana. E os modelos recebem atualizações e mudanças que alteram suas capacidades.
Então, o ponto aqui não é que o Claude 3 Opus é objetivamente o melhor modelo e sempre será…
É que você precisa testar todos os principais modelos. Porque é muito fácil descobrir de repente que seu modelo favorito foi superado da noite para o dia.
…Mas prepare-se para o que está por vir
Apesar dos (merecidos) elogios ao Claude 3 Opus, Roetzer diz que precisamos manter um ponto importante em mente:
O GPT-4 foi lançado em março de 2023. Ele parou de treinar seis meses antes de ser lançado.
“Portanto, todos estão agora superando um modelo que tem 18 meses,” afirma.
“A OpenAI não parou de construir e treinar um modelo mais poderoso. Então, se todas essas empresas estão apenas alcançando o GPT-4 e apenas superando-o levemente, como será o GPT-5?”
Portanto, definitivamente teste todos os modelos atuais o máximo possível.
Mas também entenda:
Modelos e capacidades significativamente melhores estão a caminho. Potencialmente muito em breve.
Conteúdo relacionado
40% das Compras Pmax de uma Marca de E-commerce Foram Exibidas em Sites MFA Criados por IA e Domínios Inativos
[the_ad id="145565"] A crescente presença de sites gerados por inteligência artificial voltados para a publicidade está dificultando a tarefa dos anunciantes em garantir que…
Como o Anúncio de Fim de Ano da Coca-Cola com IA Passou de Elogios a Raiva
[the_ad id="145565"] Inicialmente, o remake da Coca-Cola de seu comercial de 1995, “As Férias Estão Chegando,” alimentado por IA, parecia ser bem recebido. A System1, que testa…
Dentro da Estratégia de Dados Focada no Cliente de Chris Marino no Google
[the_ad id="145565"] No episódio deste podcast The Speed of Culture, o fundador e apresentador da Suzy, Matt Britton, conversa com Chris Marino, chefe de agência da Google…