Inscreva-se em nossos boletins diários e semanais para as últimas atualizações e conteúdo exclusivo sobre a cobertura líder em IA do setor. Saiba mais
Durante o fim de semana, o gigante da busca na web da China, Baidu anunciou o lançamento de dois novos modelos de IA, ERNIE 4.5 e ERNIE X1, um modelo de linguagem multimodal e um modelo de raciocínio, respectivamente.
A Baidu afirma que eles oferecem desempenho de ponta em uma variedade de métricas, superando o modelo de raciocínio não – racional da DeepSeek V3 e o GPT-4.5 da OpenAI (qual a sua opinião sobre a escolha do nome semelhante pela Baidu?) em vários testes de benchmark de terceiros, como o C-Eval (avaliando o desempenho de LLM chinês em conhecimento e raciocínio em 52 disciplinas), CMMLU (entendimento de linguagem multitarefa massivo em chinês), e GSM8K (problemas de palavras matemáticas).

Além disso, a Baidu afirma que subverte o custo de ambos, o modelo de raciocínio DeepSeek R1 com o ERNIE X1 em 50% e o gigante de IA dos EUA, OpenAI com o GPT-4.5 com o ERNIE 4.5 em 99%, respectivamente.
No entanto, ambos têm limitações importantes, incluindo a falta de licenciamento de código aberto no primeiro caso (o que o DeepSeek R1 oferece) e um contexto drasticamente reduzido em comparação com o último (8.000 tokens em vez de 128.000, o que é uma quantidade surpreendentemente baixa nesta era de janelas de contexto de mais de um milhão de tokens. Tokens são a forma como um grande modelo de IA representa informações, com mais tokens significando mais informações. Uma janela de 128.000 tokens é equivalente a um romance de 250 páginas).
Como observou o usuário do X @claudeglass em um post, a pequena janela de contexto torna-o talvez apenas adequado para chatbots de atendimento ao cliente.
A Baidu publicou no X que planeja tornar a família de modelos ERNIE 4.5 de código aberto em 30 de junho de 2025.
A Baidu habilitou o acesso aos modelos através de sua interface de programação de aplicativos (API) e um rival em chinês ao ChatGPT, conhecido como “ERNIE Bot” — ele responde a perguntas, gera texto, produz escrita criativa e interage de forma conversacional com os usuários — e tornou o ERNIE Bot gratuito para acessar.
ERNIE 4.5: Uma nova geração de IA multimodal
ERNIE 4.5 é o mais recente modelo fundamental da Baidu, projetado como um sistema multimodal nativo capaz de processar e entender texto, imagens, áudio e vídeo, sendo um concorrente claro do modelo GPT-4.5 da OpenAI lançado em fevereiro de 2025.
O modelo foi otimizado para melhor compreensão, geração, raciocínio e memória. As melhorias incluem prevenção aprimorada de alucinações, raciocínio lógico e capacidades de programação.
De acordo com a Baidu, o ERNIE 4.5 supera o GPT-4.5 em múltiplos benchmarks, mantendo um custo significativamente menor.
Os avanços do modelo decorrem de várias tecnologias principais, incluindo Máscara de Atenção Dinâmica FlashMask, Mistura de Especialistas Multimodal Heterogênea e Aprendizado de Reforço Progressivo Potencializado.
ERNIE X1 introduz capacidades avançadas de raciocínio profundo, enfatizando compreensão, planejamento, reflexão e evolução.
Ao contrário dos modelos de IA multimodal padrão, o ERNIE X1 é especificamente projetado para raciocínio complexo e uso de ferramentas, permitindo a realização de tarefas como busca avançada, perguntas e respostas baseadas em documentos, interpretação de imagens geradas por IA, execução de código e análise de páginas da web.
O modelo suporta uma gama de ferramentas, incluindo busca acadêmica da Baidu, busca de informações comerciais e ferramentas de pesquisa de franquias. Seu desenvolvimento é baseado em Aprendizado por Reforço Progressivo, Treinamento de Ponta a Ponta integrando Cadeias de Pensamento e Ação, e um Sistema de Recompensa Multi-Facetado Unificado.
Acesso e disponibilidade da API
Os usuários agora podem acessar tanto o ERNIE 4.5 quanto o ERNIE X1 através do site oficial do ERNIE Bot.
Para usuários e desenvolvedores corporativos, o ERNIE 4.5 já está disponível através da plataforma Qianfan da Baidu AI Cloud via acesso à API. O ERNIE X1 deve estar disponível em breve.
Preços para Acesso à API:
- ERNIE 4.5:
- Entrada: $0.55 USD por 1 milhão de tokens
- Saída: $2.2 por 1M tokens
- ERNIE X1:
- Entrada: $0.28 por 1M tokens
- Saída: $1.1 por 1M tokens
Compare isso com:
- DeepSeek R1
- Entrada: $0.55 por 1M tokens
- Saída: $2.19 por 1M tokens
A Baidu também anunciou planos de integrar o ERNIE 4.5 e o ERNIE X1 em seu ecossistema mais amplo, incluindo a Busca da Baidu e o aplicativo Wenxiaoyan.
Considerações para tomadores de decisão em empresas
Para CIOs, CTOs, líderes de TI e equipes de DevOps, o lançamento do ERNIE 4.5 e do ERNIE X1 apresenta oportunidades e considerações:
- Desempenho vs. Custo – Com preços significativamente mais baixos do que os modelos concorrentes, as organizações que avaliam soluções de IA podem ver economia de custos ao integrar os modelos ERNIE via API. No entanto, mais benchmarking e testes no mundo real podem ser necessários para avaliar o desempenho para aplicações empresariais específicas.
- Capacidades Multimodais e de Raciocínio – A capacidade de processar e entender texto, imagens, áudio e vídeo pode ser valiosa para empresas em setores como suporte ao cliente, geração de conteúdo, tecnologia jurídica e finanças.
- Integração de Ferramentas – A capacidade do ERNIE X1 de trabalhar com ferramentas como busca avançada, perguntas e respostas baseadas em documentos e interpretação de código pode oferecer ganhos de automação e eficiência em ambientes corporativos.
- Ecosistema e Localização – Como os modelos de IA da Baidu são otimizados para processamento em idioma chinês e conhecimento regional, empresas que atuam na China ou que visam mercados de língua chinesa podem achar os modelos ERNIE mais eficazes do que alternativas globais.
- Licenciamento e Privacidade de Dados – Embora a Baidu tenha indicado que o GPT-4.5 será disponibilizado como código aberto até o final do verão, em 30 de junho de 2025, ainda faltam três meses, então as empresas devem, pelo menos, esperar até essa data para avaliar se vale a pena implementá-lo localmente ou em serviços de nuvem hospedados nos EUA. Os usuários corporativos devem revisar as políticas da Baidu em relação à privacidade de dados, conformidade e uso de modelos antes de integrar essas soluções de IA.
Expansão de IA e perspectivas futuras
À medida que o desenvolvimento de IA acelera em 2025, a Baidu está se posicionando como líder em tecnologias de IA multimodal e baseadas em raciocínio.
A empresa planeja continuar investindo em inteligência artificial, centros de dados e infraestrutura de nuvem para melhorar as capacidades de seus modelos fundamentais.
Oferecendo uma combinação de desempenho poderoso e custos reduzidos, os mais recentes modelos de IA da Baidu visam fornecer a empresas e usuários individuais ferramentas de IA mais acessíveis e avançadas.
Para mais detalhes, visite o site oficial do ERNIE Bot.
Insights diários sobre casos de uso de negócios com o VB Daily
Se você quer impressionar seu chefe, o VB Daily tem o que você precisa. Oferecemos informações sobre o que as empresas estão fazendo com a IA generativa, desde mudanças regulatórias até implantações práticas, para que você possa compartilhar insights para o máximo retorno sobre investimento.
Leia nossa Política de Privacidade
Obrigado por se inscrever. Confira mais boletins do VB aqui.
Ocorreu um erro.

Conteúdo relacionado
Nvidia irá construir um centro de pesquisa em computação quântica acelerada.
[the_ad id="145565"] A Nvidia anunciou que está construindo um centro de pesquisa em Boston para fornecer tecnologias de ponta que avancem a computação quântica. O Nvidia…
O Google adiciona um recurso de ‘canvas’ ao Gemini, além da Visão Geral em Áudio.
[the_ad id="145565"] Dizem que a imitação é a forma mais sincera de flerte, e o Google parece concordar. Na terça-feira, a empresa adicionou um recurso ao seu chatbot Gemini,…
Como assistir ao GTC 2025 da Nvidia, incluindo a apresentação do CEO Jensen Huang
[the_ad id="145565"] O GTC, a maior conferência da Nvidia do ano, retorna esta semana, com os principais anúncios provavelmente vindo na terça-feira. Se você não puder…