DeepSeek V4 dirilis pada akhir April, Liang Wenfeng mengonfirmasi secara internal: jendela token jutaan, sepenuhnya berjalan di chip Huawei Ascend 950 PR

動區BlockTempo

DeepSeek 创办人梁文锋在内部沟通中亲口确认,新一代旗舰模型 V4 将于 4 月下旬正式发布。泄露规格显示总引参数量逼近 1 兆、支持 100 万 tokens 上下文,更将完全执行于华为昇腾晶片,被视为中国 AI 突破辉达依赖的关键一步。
(前情提要:DeepSeek V4 拒绝辉达 找华为!阿里、比特币跳动、腾讯抢买昇腾950PR晶片)
(背景补充:DeepSeek 上线「专家模式」和「视觉模式」,V4 正式推出前最后暖身?)

据《新浪财经》引述知情人士消息,DeepSeek 创办人梁文锋已透露新一代旗舰大模型 DeepSeek V4 将于 4 月下旬正式亮相。官方虽尚未公布确切日期,但开发者社群已率先感受到暖身信号:V4-Lite 变体正在 API 节点测试中,推理速度较上一代提升 30%,128K tokens 的上下文召回率达到 94%。

千亿引参数、百万 token 视窗

根据目前流出的未官方确认信息,V4 架构沿用 Mixture-of-Experts(MoE)设计,总引参数量约 1 兆,但每个 token 实际启用的引参数仅约 370 亿,在算力效率上维持 DeepSeek 一贯的「精算师」风格。

上下文视窗部分:V4 通过全新的 Engram 模块,有望支持 100 万 tokens 的超长上下文,与当前顶尖模型较劲。Engram 的核心概念是条件记忆查询,让模型能以 O(1) 的复杂度存取知识,而非随着序列长度线性膨胀。

在能力面,泄露的基准测试显示 HumanEval 达 90%、SWE-bench Verified 超过 80%,若资料属实,也直逼现有主流旗舰模型。模态方面,V4 原生支持文字、图片与影片输入,定价则约 $0.30/MTok(输入),延续 DeepSeek 低价策略。

完全跑在华为晶片上:最大的地缘政治信号

技术规格之外,V4 最受外界关注的一点是硬件策略的彻底转向:官方称整个模型将完全执行于华为昇腾 950 PR 晶片,不依赖任何辉达 GPU。

这个决定的影响远超 DeepSeek 本身。阿里巴巴、比特币跳动、腾讯已陆续大量采购华为新一代晶片,若 V4 成功验证昇腾可以撑起顶级旗舰模型的训练与推理需求,将是中国 AI 产业链在晶片自主化上迄今最具说服力的实战案例。

美国对辉达出口的管制措施在这个脉络下,反而可能成为加速中国自主生态系统成熟的催化剂。

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.
Komentar
0/400
Tidak ada komentar