O mais novo modelo de IA de destaque da Anthropic, Claude 3.7 Sonnet, custou “alguns dezenas de milhões de dólares” para ser treinado, utilizando menos de 10^26 FLOPs de poder computacional.
Essa informação foi confirmada pelo professor da Wharton, Ethan Mollick, que em uma postagem no X na segunda-feira relatou uma clarificação que recebeu da equipe de relações públicas da Anthropic. “Fui contatado pela Anthropic, que me informou que o Sonnet 3.7 não seria considerado um modelo de 10^26 FLOPs e que custou alguns dezenas de milhões de dólares,” ele escreveu, “embora modelos futuros serão muito maiores.”
A TechCrunch entrou em contato com a Anthropic para confirmação, mas não recebeu uma resposta até o momento da publicação.
Considerando que o Claude 3.7 Sonnet realmente custou apenas “alguns dezenas de milhões de dólares” para ser treinado, sem considerar despesas relacionadas, isso é um sinal de como está se tornando relativamente barato lançar modelos de ponta. O Claude 3.5, predecessor do Sonnet, lançado no outono de 2024, também custou alguns dezenas de milhões de dólares para treinar, revelou o CEO da Anthropic, Dario Amodei, em um ensaio recente.
Esses totais se comparam de maneira favorável aos preços de treinamento dos principais modelos de 2023. Para desenvolver seu modelo GPT-4, a OpenAI gastou mais de US$ 100 milhões, segundo o CEO da OpenAI, Sam Altman. Enquanto isso, o Google gastou quase US$ 200 milhões para treinar seu modelo Gemini Ultra, conforme uma estimativa de um estudo de Stanford estimou.
Por outro lado, Amodei espera que futuros modelos de IA custem bilhões de dólares. Certamente, os custos de treinamento não incluem trabalho como testes de segurança e pesquisa fundamental. Além disso, conforme a indústria de IA adota modelos de “raciocínio” que trabalham em problemas por períodos prolongados, os custos computacionais de execução dos modelos provavelmente continuarão a aumentar.
Conteúdo relacionado
A OpenAI lança pesquisa aprofundada para usuários pagos do ChatGPT.
[the_ad id="145565"] Here’s the rewritten content in Portuguese while keeping the HTML tags intact: <div> <p id="speakable-summary" class="wp-block-paragraph">A…
Os robôs humanoides da Apptronik dão os primeiros passos rumo à autoconstrução.
[the_ad id="145565"] Apptronik, uma fabricante de robôs humanoides com sede em Austin, anunciou na terça-feira uma nova parceria piloto com a gigante americana de cadeia de…
A IA Claude da Anthropic está jogando Pokémon na Twitch — devagar
[the_ad id="145565"] Na tarde de terça-feira, a Anthropic lançou Claude Plays Pokémon no Twitch, uma transmissão ao vivo do mais novo modelo de IA da Anthropic, Claude 3.7…