O Claude 3 Opus agora compete com o GPT-4 como o modelo de IA mais poderoso disponível.
Isso é de acordo com um importante ranking do LMSYS.org chamado Chatbot Arena. A Arena utiliza tanto crowdsourcing quanto classificações Elo para avaliar as capacidades dos modelos de IA.
(E é considerado uma fonte confiável por muitos especialistas da indústria.)
Até o momento da publicação, o Claude 3 Opus ocupa o primeiro lugar. Esses rankings estão sempre mudando e, em alguns momentos durante a redação, o Claude 3 Opus esteve em primeiro lugar sozinho ou empatado com o GPT-4.
O que isso significa para quem utiliza esses modelos nos negócios?
Mais importante ainda, como podemos acompanhar tudo isso?!
Consegui as respostas com o fundador/CEO do Marketing AI Institute, Paul Roetzer no Episode 90 do The Artificial Intelligence Show.
A conquista é impressionante…
Estamos satisfeitos com o desempenho do Claude 3 Opus em nossos experimentos. Ele rapidamente se tornou um modelo de referência para nosso trabalho.
Mas é apenas o mais recente vencedor em uma competição sempre dinâmica.
“É um campo que se move rapidamente,” diz Roetzer. “Acho que isso demonstra quão dinâmico é esse espaço.”
Recebemos novos modelos quase toda semana. E os modelos recebem atualizações e mudanças que alteram suas capacidades.
Então, o ponto aqui não é que o Claude 3 Opus é objetivamente o melhor modelo e sempre será…
É que você precisa testar todos os principais modelos. Porque é muito fácil descobrir de repente que seu modelo favorito foi superado da noite para o dia.
…Mas prepare-se para o que está por vir
Apesar dos (merecidos) elogios ao Claude 3 Opus, Roetzer diz que precisamos manter um ponto importante em mente:
O GPT-4 foi lançado em março de 2023. Ele parou de treinar seis meses antes de ser lançado.
“Portanto, todos estão agora superando um modelo que tem 18 meses,” afirma.
“A OpenAI não parou de construir e treinar um modelo mais poderoso. Então, se todas essas empresas estão apenas alcançando o GPT-4 e apenas superando-o levemente, como será o GPT-5?”
Portanto, definitivamente teste todos os modelos atuais o máximo possível.
Mas também entenda:
Modelos e capacidades significativamente melhores estão a caminho. Potencialmente muito em breve.
Conteúdo relacionado
Stagwell Nomeia John Kahan como o Primeiro Diretor de IA
[the_ad id="145565"] A Stagwell, a holding que foi fundada há nove anos pelo presidente e CEO Mark Penn, anunciou a nomeação de John Kahan como seu primeiro diretor de IA.…
4 Principais Conclusões do Relatório Anual da WPP
[the_ad id="145565"] A WPP apresentou seu relatório anual, semanas após desapontar o mercado com resultados de lucros abaixo do esperado para 2024. Além dos números, o…
A Colapso do SEO Está Prestes a Causar Inflação no CPM?
[the_ad id="145565"] Apesar da recente turbulência no mercado, a revolução da IA avança rapidamente, com novas descobertas em modelos e arquiteturas sendo aplicadas em um…