DeepSeek 将 API 价格下调 90%,在华为芯片上运行 V4,并把 AI 推理推入一场全面的价格战


DeepSeek 在输入缓存命中时将 API 价格降低 90%,并在 V4-Pro 上提供 75% 的折扣,直到 5 月 5 日
这把 V4-Pro 的缓存命中定价降到约每 100 万 tokens 0.0036 美元,而输出定价远低于向西方前沿模型收取每 100 万 tokens 12–$25 美元的水平
V4-Pro 总参数量为 1.6T,每次推理传递有 49B 个活跃参数。V4-Flash 是更小的 284B 参数版本
V4 运行在 Huawei Ascend 芯片上,而不是 NVIDIA
它也使用了显著更少的计算资源。在 1M-token 的上下文窗口下,据称 V4-Pro 只需要 V3.2 所需计算的 27%
性能仍略逊于 GPT-5.4 和 Gemini 3.1 Pro
查看原文
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论