Bolt42

Sure! Here’s the rewritten content in Portuguese while maintaining the HTML tags:

<div id="hs_cos_wrapper_post_body"><p><a target="_blank" href="https://www.linkedin.com/company/google/" rel="noopener" target="_blank">Google</a> Bard fez um salto impressionante em suas capacidades…</p><p>Ele acabou de superar o GPT-4 em um <a target="_blank" href="https://chat.lmsys.org/" rel="noopener" target="_blank">ranking de topo que avalia modelos de IA</a>.<!--more--><a target="_blank" href="https://chat.lmsys.org/" rel="noopener" target="_blank"><span style="color: #1155cc; text-decoration: underline;"><br/></span><span style="color: #1155cc; text-decoration: underline;"><br/></span></a>O ranking, chamado Chatbot Arena, é gerado pela Large Model Systems Organization. E agora mostra que o Google Bard (impulsionado pelo modelo Gemini Pro do Google) ocupa o 2º lugar em termos de desempenho.</p>
<p>O ranking leva em consideração mais de 200.000 votos humanos sobre quais modelos os usuários preferem.</p>
<p>Ele também atribui uma classificação "Elo" a cada modelo, que é um método de cálculo de habilidade em jogos de soma zero, como o xadrez.</p>
<p>Bard ainda está atrás do GPT-4 Turbo, mas agora supera outras versões do GPT-4 e outros modelos populares, como Claude e Mistral.</p>
<p>O que você deve fazer agora que Bard está subindo nas classificações?</p>
<p>No episódio 81 do The Marketing AI Show, eu consegui a resposta com o fundador/CEO do Marketing AI Institute, <a target="_blank" href="https://www.linkedin.com/in/paulroetzer/" rel="noopener" target="_blank">Paul Roetzer</a>.</p>
<p>Aqui está o que você precisa saber…</p>
<h2>Este É Um Ranking Confiável</h2>
<p>O Chatbot Arena não é apenas um site de classificação online aleatório, diz Roetzer. É uma coisa séria.</p>
<p>É confiado por alguns dos principais nomes em IA, incluindo Andrej Karpathy, um dos principais pesquisadores de IA da OpenAI. (Na verdade, Karpathy diz que é um dos <a target="_blank" href="https://twitter.com/karpathy/status/1737544497016578453?s=46&amp;t=R5LBnDmluUM1q9hD0liYVg" rel="noopener" target="_blank"><span>apenas dois sites de avaliação que ele confia</span></a>.)</p>
<h2>Funciona Através de Comparações Entre Modelos</h2>
<p>O componente de avaliação humana do Chatbot Arena funciona fazendo você comparar dois modelos com o mesmo prompt. (Daí o nome.)</p>
<p>Por exemplo, você pode dar a Bard (impulsionado pelo Gemini Pro) e ao GPT-4 o mesmo prompt, obter duas saídas diferentes e avaliar qual é a melhor.</p>
<p>Quando comparado a várias versões do GPT-4, Bard sai vencedor. No entanto, ele ainda fica atrás do GPT-4 Turbo, a versão mais recente do modelo mais avançado da OpenAI.</p>
<p>Além disso, o Gemini Pro, que agora alimenta Bard após uma <a target="_blank" href="https://bard.google.com/updates" rel="noopener" target="_blank"><span>atualização em dezembro de 2023</span></a>, nem é a versão mais poderosa dos novos modelos do Google.</p>
<p>O Gemini Ultra é a versão mais poderosa da família de modelos avançados do Google—e o Google planeja incorporá-lo em seus serviços e ferramentas de IA no futuro. O que significa que Ultra pode representar um avanço ainda maior.</p>
<h2>Sua Empresa Também Precisa Ter Seu Próprio “Chatbot Arena”</h2>
<p>Isso não significa que você deve abandonar todas as suas outras ferramentas e mudar para Bard, diz Roetzer.</p>
<p>As ferramentas de IA evoluem em um ritmo insano. Como Bard nos mostra, uma ferramenta que estava atrás pode rapidamente se tornar líder, quase da noite para o dia.</p>
<p>“É por isso que é tão difícil fazer apostas sobre qual plataforma usar e quais integrar aos seus fluxos de trabalho”, diz Roetzer. “Porque elas continuam evoluindo sobre qual é a melhor para quais casos de uso.”</p>
<blockquote>
<p>“Você precisa estar constantemente testando diferentes ferramentas.”</p>
</blockquote>
<p>Roetzer recomenda que um ou mais membros da equipe testem diferentes ferramentas contra seus casos de uso de IA principais (redação de blogs, sumarização, escrita de roteiros etc.) a cada 30-90 dias—ou sempre que os rankings sofrerem uma mudança significativa.</p>
<p>“Vá e execute esses testes de casos de uso contra os diferentes sistemas e veja se alguém fez um avanço que muda o tipo de tecnologia que o resto de sua equipe deve estar usando.”</p></div><script async src="//platform.twitter.com/widgets.js" charset="utf-8"></script><script>(function(d, s, id) {
  var js, fjs = d.getElementsByTagName(s)[0];
  if (d.getElementById(id)) return;
  js = d.createElement(s); js.id = id;
  js.src = "//connect.facebook.net/en_GB/sdk.js#xfbml=1&version=v3.0";
  fjs.parentNode.insertBefore(js, fjs);
 }(document, 'script', 'facebook-jssdk'));</script>

If you need any more adjustments or translations, feel free to ask!

Bolt42