Bolt42

O Claude 3 Opus agora compete com o GPT-4 como o modelo de IA mais poderoso disponível.

Isso é de acordo com um importante ranking do LMSYS.org chamado Chatbot Arena. A Arena utiliza tanto crowdsourcing quanto classificações Elo para avaliar as capacidades dos modelos de IA.

(E é considerado uma fonte confiável por muitos especialistas da indústria.)

Até o momento da publicação, o Claude 3 Opus ocupa o primeiro lugar. Esses rankings estão sempre mudando e, em alguns momentos durante a redação, o Claude 3 Opus esteve em primeiro lugar sozinho ou empatado com o GPT-4.

O que isso significa para quem utiliza esses modelos nos negócios?

Mais importante ainda, como podemos acompanhar tudo isso?!

Consegui as respostas com o fundador/CEO do Marketing AI Institute, Paul Roetzer no Episode 90 do The Artificial Intelligence Show.

A conquista é impressionante…

Estamos satisfeitos com o desempenho do Claude 3 Opus em nossos experimentos. Ele rapidamente se tornou um modelo de referência para nosso trabalho.

Mas é apenas o mais recente vencedor em uma competição sempre dinâmica.

“É um campo que se move rapidamente,” diz Roetzer. “Acho que isso demonstra quão dinâmico é esse espaço.”

Recebemos novos modelos quase toda semana. E os modelos recebem atualizações e mudanças que alteram suas capacidades.

Então, o ponto aqui não é que o Claude 3 Opus é objetivamente o melhor modelo e sempre será…

É que você precisa testar todos os principais modelos. Porque é muito fácil descobrir de repente que seu modelo favorito foi superado da noite para o dia.

…Mas prepare-se para o que está por vir

Apesar dos (merecidos) elogios ao Claude 3 Opus, Roetzer diz que precisamos manter um ponto importante em mente:

O GPT-4 foi lançado em março de 2023. Ele parou de treinar seis meses antes de ser lançado.

“Portanto, todos estão agora superando um modelo que tem 18 meses,” afirma.

“A OpenAI não parou de construir e treinar um modelo mais poderoso. Então, se todas essas empresas estão apenas alcançando o GPT-4 e apenas superando-o levemente, como será o GPT-5?”

Portanto, definitivamente teste todos os modelos atuais o máximo possível.

Mas também entenda:

Modelos e capacidades significativamente melhores estão a caminho. Potencialmente muito em breve.



Bolt42