DeepSeek V4 は4月下旬にリリースされ、梁文鋒が社内で確認:100万 token のウィンドウ、完全に Huawei 昇騰 950 PR チップ上で動作

動區BlockTempo

DeepSeekの創業者である梁文鋒が、社内でのコミュニケーションの中で自ら、新世代のフラッグシップモデルV4は4月下旬に正式にリリースされると口頭で確認した。漏えいされた仕様によれば、総パラメータ数は1兆に迫り、12.8万トークン級のコンテキストをサポートし、さらに完全に華為の昇騰チップで実行されるとされており、中国のAIがNVIDIAへの依存から脱するうえでの重要な一歩だと見なされている。
(前情提要:DeepSeek V4はNVIDIAを拒否し、華為に!アリ、バイトダンス、テンセントは昇騰950PRチップを買い漁る)
(背景補足:DeepSeekが「エキスパートモード」と「ビジュアルモード」を開始。V4正式リリース前の最後のウォームアップ?)

『新浪財経』が伝えるところによれば、事情に詳しい関係者の消息として、DeepSeekの創業者である梁文鋒は、新世代のフラッグシップ大規模モデルDeepSeek V4は4月下旬に正式に登場すると明かしている。公式はまだ確定日を公表していないものの、開発者コミュニティは先にウォームアップのサインを感じ取っている。V4-LiteのバリアントはAPIノードでのテスト中で、推論速度は前世代より30%向上し、128K tokensのコンテキスト想起率は94%に達している。

80億引数、100万トークンのウィンドウ

現時点で出回っている未公式の確認情報によると、V4のアーキテクチャはMixture-of-Experts(MoE)設計を踏襲している。総パラメータ数は約1兆だが、各トークンで実際に有効化される引数は約370億にとどまり、計算効率の面ではDeepSeekが一貫してきた「精密計算者」スタイルを維持している。

コンテキストウィンドウの部分について:V4は新しいEngramモジュールにより、100万トークン級の超長コンテキストをサポートできる見込みがあり、現在のトップモデルと競り合う。Engramの中核コンセプトは条件付き記憶検索であり、モデルが系列長に比例して線形に膨張するのではなく、O(1)の複雑度で知識にアクセスできるようにすることだ。

能力面では、漏えいされたベンチマークテストでHumanEvalが90%、SWE-bench Verifiedが80%超であることが示されており、もしデータが事実なら、既存の主流フラッグシップモデルに迫る。モダリティ面では、V4はテキスト、画像、動画の入力をネイティブにサポートし、価格は約$0.30/MTok(入力)で、DeepSeekの低価格戦略を引き継ぐ。

完全に華為のチップ上で稼働:最大の地政学的シグナル

技術仕様のほかに、V4で最も注目されているのはハードウェア戦略の徹底した転換点だ。公式では、モデル全体が華為の昇騰950 PRチップ上で完全に実行され、いかなるNVIDIAのGPUにも依存しないとしている。

この判断の影響はDeepSeek自身をはるかに超える。アリババ、バイトダンス、テンセントはすでに華為の次世代チップを大量に調達している。もしV4が昇騰がトップレベルのフラッグシップモデルの学習および推論需要を支えられることを検証できれば、中国のAI産業チェーンにおけるチップの国産化で、これまでで最も説得力のある実戦事例になるだろう。

この文脈では、米国によるNVIDIAへの輸出規制の措置が、むしろ中国の自前のエコシステムが成熟することを加速する触媒になり得る。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし