DeepSeek 山创始人梁文锋在沟通内部中亲口确认,新一代旗舰模型 V4 将于 4 月下旬正式发布。泄露规格显示总引参数量逼近 1 兆、支援 100 万 tokens 上下文,更将完全执行于华为昇腾芯片,被视为中国 AI 突破辉达依赖的关键一步。
(前情提要:DeepSeek V4 拒绝辉达 找华为!阿里、字节跳动、腾讯抢买昇腾950PR芯片)
(背景补充:DeepSeek 上线「专家模式」和「视觉模式」,V4 正式推出前最后暖身?)
据《新浪财经》引述知情人士消息,DeepSeek 创办人梁文锋已透露新一代旗舰大模型 DeepSeek V4 将于 4 月下旬正式亮相。官方虽尚未公布确切日期,但开发者社群已率先感受到暖身信号:V4-Lite 变体正在 API 节点测试中,推理速度较上一代提升 30%,128K tokens 的上下文召回率达到 94%。
根据目前流出的未官方确认信息,V4 架构沿用 Mixture-of-Experts(MoE)设计,总引参数量约 1 兆,但每个 token 实际启用的引参数仅约 370 亿,在算力效率上维持 DeepSeek 一贯的「精算师」风格。
上下文视窗部分:V4 通过全新的 Engram 模组,有望支援 100 万 tokens 的超长上下文,与当前顶尖模型较劲。Engram 的核心概念是条件记忆查询,让模型能以 O(1) 的复杂度存取知识,而非随序列长度线性膨胀。
在能力面,泄露的基准测试显示 HumanEval 达 90%、SWE-bench Verified 超过 80%,若数据属实,也直逼现有主流旗舰模型。模态方面,V4 原生支援文字、图片与影片输入,定价则约 $0.30/MTok(输入),延续 DeepSeek 低价策略。
技术规格之外,V4 最受外界关注的一点是硬件策略的彻底转向:官方称整个模型将完全执行于华为昇腾 950 PR 芯片,不依赖任何辉达 GPU。
这个决定的影响远超 DeepSeek 本身。阿里巴巴、字节跳动、腾讯已陆续大量采购华为新一代芯片,若 V4 成功验证昇腾可支撑顶级旗舰模型的训练与推理需求,将是中国 AI 产业链在芯片自主化上迄今最具说服力的实战案例。
美国对辉达出口的管制措施在这个脉络下,反而可能成为加速中国自主生态系统成熟的催化剂。