DeepSeek reduz preços da API em 90%, executa V4 em chips Huawei e impulsiona inferência de IA para uma guerra de preços completa


DeepSeek cortou os preços da API em 90% em acertos de cache de entrada e está oferecendo um desconto de 75% no V4-Pro até 5 de maio
Isso leva o preço de acerto de cache do V4-Pro para cerca de $0,0036 por milhão de tokens, enquanto o preço de saída fica muito abaixo dos modelos de fronteira ocidental cobrando $12–$25 por milhão de tokens
V4-Pro possui 1,6T de parâmetros totais, com 49B ativos por passagem de inferência. V4-Flash é a versão menor com 284B de parâmetros
V4 roda em chips Huawei Ascend, não NVIDIA
Também usa muito menos computação. Com uma janela de contexto de 1 milhão de tokens, o V4-Pro supostamente precisa de apenas 27% da computação exigida pelo V3.2
O desempenho ainda fica um pouco atrás do GPT-5.4 e Gemini 3.1 Pro
Ver original
post-image
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar