DeepSeek réduit les prix de l'API de 90 %, exécute V4 sur des puces Huawei, et pousse l'inférence IA dans une guerre des prix à grande échelle


DeepSeek a réduit de 90 % les prix de l'API sur les hits du cache d'entrée et offre une remise de 75 % sur V4-Pro jusqu'au 5 mai
Cela porte le prix du hit du cache V4-Pro à environ 0,0036 $ pour un million de tokens, tandis que le prix de sortie est bien en dessous des modèles occidentaux de pointe facturant 12–$25 par million de tokens
V4-Pro possède 1,6 trillion de paramètres au total, avec 49 milliards actifs par passage d'inférence. V4-Flash est la version plus petite avec 284 milliards de paramètres
V4 fonctionne sur des puces Huawei Ascend, pas NVIDIA
Il utilise également beaucoup moins de calculs. Avec une fenêtre de contexte de 1 million de tokens, V4-Pro aurait besoin seulement de 27 % du calcul requis par V3.2
Les performances sont encore légèrement en dessous de GPT-5.4 et Gemini 3.1 Pro
Voir l'original
post-image
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler