英偉達開始賣造鑽石的方法了

作者:Ada,深潮 TechFlow

舊金山,聖荷西會議中心,GTC 現場。

英偉達首席科學家 Bill Dally 坐在台上,對面是谷歌的 Jeff Dean。兩個人聊到一半,Dally 抛出一個數字:“此前移植一個包含約 2500 至 3000 個單元的標準單元庫,需要 8 名工程師組成的團隊耗時約 10 個月。”

他停了一下。

“現在僅需單卡 GPU,跑一個晚上。”

台下沒有驚呼,因為聽懂這句話的人都明白意味著什麼。8 名工程師 10 個月的工作,被一顆自家產的 GPU 一夜之間吃掉了。而且 Dally 還補充道:跑出來的結果在面積、功耗、延遲這三個指標上,匹配甚至超過人類設計。

第二天就有新聞解讀成“英偉達用 AI 設計 GPU”。

但這事的真相,遠比新聞標題值得玩味的多。

英偉達內部在跑什麼?

英偉達內部跑的也不是黑箱,是幾套磨了幾年的工具鏈。

NB-Cell 是一個基於強化學習的程式,專幹標準單元庫遷移這種最苦的活。Prefix RL 旨在解決進位前瞻鏈中前瞻階段的放置這一長期研究難題。Dally 表示,該系統生成的佈局“是人類永遠無法想到的”,與人類設計相比,關鍵指標提升了約 20% 到 30%。

再就是兩個內部 LLM,Chip Nemo 和 Bug Nemo。英偉達將歷史上每一顆 GPU 的 RTL 代碼、架構文件、設計規格喂給這兩個大模型。按照 Dally 的描述是,這相當於把英偉達從 G80 到 Blackwell 二十年的肌肉記憶蒸餾成了一個內部模型,新人進去就直接對接二十年功力的資深工程師。

那麼“AI 可以設計 GPU”了嗎?

恰恰相反。 Dally 的原話是:“我很希望有一天能直接說‘給我設計一顆新 GPU’,但我們離那一步還很遠。”

英偉達沒用 AI 設計出 GPU。但它做的另一件事讓整個行業以後沒它玩不轉。

20 億美元買進 EDA 腹地

2025 年 12 月 1 日,英偉達以 20 億美元入股 EDA 三巨頭之一的 Synopsys。雙方簽了聯合開發協議,把英偉達的加速計算棧嵌入 Synopsys 整條 EDA 工作流程,Blackwell 和下一代 Rubin GPU 要跟 Synopsys.ai 做深度整合。

Synopsys 的地位需要解釋一下。全球每一顆先進製程晶片,蘋果 M 系列、AMD MI 系列、Google TPU,設計階段幾乎都跑在 Synopsys 或者 Cadence 的工具鏈上。這兩家加上西門子 EDA,壟斷了晶片設計的底層工具。你可以不用高通的晶片,可以不用台積電的產線,但你綁不開這三家的軟體。

入股 Synopsys 之後三個月,英偉達把 Cadence、Siemens、Dassault 也拉了進來,宣布它們都在基於英偉達 GPU 開發 AI 驅動的晶片設計工具。

英偉達公布的基準測試數據擺出來挺嚇人:Synopsys PrimeSim 在 Blackwell 上快 30 倍,Proteus 快 20 倍,Sentaurus 在 B200 上對比 CPU 加速 12 倍。聯發科用 H100 把 Cadence Spectre 提速 6 倍。Astera Labs 用 Synopsys + NVIDIA 把晶片驗證提速 3.5 倍。

有一個細節值得單獨拎出來:Cadence 的 Millennium M2000 平台,標的是“專為 EDA 市場打造,獨家基於 NVIDIA Blackwell”。

獨家兩個字最值得品。也就是說,EDA 工具以前跑在 CPU 上,Intel、AMD 都能玩。今後想用最快的 EDA,只能買英偉達的卡。

飛輪的真實形狀

英偉達的飛輪,大多數人理解的版本是這樣的:賣 GPU 給 AI 公司,AI 公司訓練大模型,大模型證明 GPU 不可取代,更多人買 GPU。

這個飛輪已經夠可怕了。但在它下面還有一層。

英偉達用自己的工具設計下一代 GPU,設計效率拉開代際差距,同時把整個行業的 EDA 工具鏈綁在自家硬體上。競爭對手想追,但連追的工具都得從英偉達的生態裡租。

AMD 那份讓股價大跌的財報背後藏的就是這層焦慮。即便英偉達和 Synopsys 表面上說“投資不附帶任何採購英偉達硬體的義務”,市場也心知肚明:加速版 EDA 功能首發都在英偉達硬體上,AMD 和 Intel 只能依賴一條“為最大對手平台調優的路徑”。

設想一下 AMD 的工程師以後想設計一顆對標 Blackwell 的晶片,他打開 Synopsys 的工具,這個工具在英偉達 GPU 上跑得最快。那麼他要么忍受慢一倍的設計週期,要么買一堆英偉達的卡來設計要打敗英偉達的晶片。

鏟子還在賣。但賣法變了。

國產 GPU 的真實處境

講到這裡,必須給一組讓人清醒的數字。

英偉達 2025 財年淨利潤突破 700 億美元的同一年,國產 GPU“四小龍”摩爾晶線、沐曦、壁仞、燧原,擠在 IPO 的窗口前排隊。

摩爾晶線招股書顯示,2022 年到 2024 年,三年累計淨虧損 50 億元,2025 年上半年再虧 2.71 億元,截至 6 月 30 日累計未彌補虧損 14.78 億元。公司管理層自己預計,最早 2027 年才能實現合併報表盈利。沐曦稍好一些,三年累計虧損超過 30 億元。最慘的是壁仞,三年半虧損超過 63 億元,2025 年上半年的收入只有 5890 萬元,連摩爾晶線同期 7.02 億的零頭都不到。

再看研發投入的強度。摩爾晶線 2022 年的研發費用占營收比例是 2422.51%,2024 年仍然高達 309.88%。一年研發花掉的錢,是收入的三倍多。這不是企業經營,這是輸液續命,靠著一級市場和最近打開的科創板窗口持續輸血。

工具層面更卡脖子。華大九天 2022 年 IPO 招股書顯示工具僅部分支持 5nm 先進製程。概倫電子能覆蓋 7nm/5nm/3nm 節點,但只做點工具,遠談不上全流程。

華大九天創始人劉偉平說得很坦率:“國產 EDA 對先進工藝的支撐還存在明顯不足,尤其是當下的 7nm、5nm、3nm 等。目前國產 EDA 可以做到 14nm 的水平,雖然掌握了 7nm 工藝技術,但 7nm 在與實際應用的深度融合上還需要全產業鏈的協同發力。”

也就是說,先進製程的全流程 EDA,國產基本不能用。國產 GPU 公司設計晶片用的還是 Synopsys 和 Cadence。2025 年特朗普一度宣布對所有關鍵軟體實施出口管制,雖然沒有實質落地,但 7nm 以下先進製程 EDA 工具至今處於嚴格管制狀態。許可證什麼時候被切,開關在別人手裡。

資本市場的反應足夠魔幻。沐曦上市當天,股價收報 829.9 元,單日上漲 692.95%。摩爾晶線上市後股價一度升至 A 股第三,僅次於貴州茅台和寒武紀,有媒體按當時股價測算,其總市值約為 3595 億元。

數字背後的真實生意是,一群仍在燒錢虧損、仍要依賴被管制的境外工具鏈才能繼續設計晶片的公司,卻在二級市場被定價成“國產英偉達”的接班人。

而這些公司用來設計晶片的那套工具,正在變成英偉達生態的一部分。英偉達和 Synopsys 那 20 億美元的綁定,Cadence Millennium M2000“獨家基於 NVIDIA Blackwell”的標籤,讓追趕這件事本身變成了一個悖論。

一條從設計到製造的完整鏈

回到 GTC 那場對談。

Dally 整場表現得很謙虛。“AI 還遠遠不能自己設計晶片”,這話英偉達已經講了四五年了。但每年講法在變。四年前是“AI 可以輔助設計”,三年前是“AI 可以自動化某些環節”,今年是“一晚上做完 8 個人 10 個月的活”。每年推一步,每年留一句“距離終極目標還很遠”。三年後回頭看,上一輪的“還很遠”已經做到了,新的“還很遠”被定義在了所有對手還夠不著的位置。

英偉達過去十二個月做的事其實只有一件:把 AI 用在晶片產業鏈最值錢、護城河最深的那幾個環節,然後把這些工具一層層賣給整個行業。

晶片設計的前端,被 Chip Nemo 這種內部 LLM 接管;設計中端的標準單元庫遷移、版圖優化,被 NB-Cell、Prefix RL 接管;整個 EDA 工具鏈,通過 Synopsys 的 20 億美元和 Cadence 的“獨家基於 Blackwell”綁在自家 GPU 上;製造端的光刻計算,被 cuLitho 接管,TSMC 已經在用。

從設計到製造,每一段英偉達都用 AI 重做了一遍。每一段最後都通向同一個終點:你想用最快的工具,就得買英偉達的卡。

對所有想造一顆能打敗 Blackwell 的晶片的對手來說,最尷尬的事情已經發生了。設計這顆晶片要用的 EDA 工具,跑得最快的版本在英偉達的 GPU 上;製造這顆晶片要做的光刻計算,最快的算法庫由英偉達提供;訓練設計 AI 用的算力,還是英偉達的卡。

你要打敗的那個人,正在向你出租打敗它所需要的全部工具。租金按年付,合約每年漲價。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言