O mais novo modelo de IA de destaque da Anthropic, Claude 3.7 Sonnet, custou “alguns dezenas de milhões de dólares” para ser treinado, utilizando menos de 10^26 FLOPs de poder computacional.
Essa informação foi confirmada pelo professor da Wharton, Ethan Mollick, que em uma postagem no X na segunda-feira relatou uma clarificação que recebeu da equipe de relações públicas da Anthropic. “Fui contatado pela Anthropic, que me informou que o Sonnet 3.7 não seria considerado um modelo de 10^26 FLOPs e que custou alguns dezenas de milhões de dólares,” ele escreveu, “embora modelos futuros serão muito maiores.”
A TechCrunch entrou em contato com a Anthropic para confirmação, mas não recebeu uma resposta até o momento da publicação.
Considerando que o Claude 3.7 Sonnet realmente custou apenas “alguns dezenas de milhões de dólares” para ser treinado, sem considerar despesas relacionadas, isso é um sinal de como está se tornando relativamente barato lançar modelos de ponta. O Claude 3.5, predecessor do Sonnet, lançado no outono de 2024, também custou alguns dezenas de milhões de dólares para treinar, revelou o CEO da Anthropic, Dario Amodei, em um ensaio recente.
Esses totais se comparam de maneira favorável aos preços de treinamento dos principais modelos de 2023. Para desenvolver seu modelo GPT-4, a OpenAI gastou mais de US$ 100 milhões, segundo o CEO da OpenAI, Sam Altman. Enquanto isso, o Google gastou quase US$ 200 milhões para treinar seu modelo Gemini Ultra, conforme uma estimativa de um estudo de Stanford estimou.
Por outro lado, Amodei espera que futuros modelos de IA custem bilhões de dólares. Certamente, os custos de treinamento não incluem trabalho como testes de segurança e pesquisa fundamental. Além disso, conforme a indústria de IA adota modelos de “raciocínio” que trabalham em problemas por períodos prolongados, os custos computacionais de execução dos modelos provavelmente continuarão a aumentar.
Conteúdo relacionado
A Escape.ai de John Gaeta cria uma plataforma para o entretenimento emergente.
[the_ad id="145565"] Escape.ai lançou a versão beta de sua plataforma de distribuição de conteúdo Neo Cinema e mercado de criadores para impulsionar formas emergentes de…
Os modelos de IA mais populares: o que fazem e como utilizá-los
[the_ad id="145565"] Modelos de IA estão sendo lançados em um ritmo alucinado, por todos, desde grandes empresas de tecnologia como o Google até startups como OpenAI e…
O Poe do Quora agora permite que usuários criem e compartilhem aplicativos personalizados com inteligência artificial.
[the_ad id="145565"] O Poe, a plataforma da Quora que reúne vários modelos de IA em um único lugar, lançou uma nova funcionalidade que permite aos usuários criar interfaces…