Jensen Huang Khai Mác Kỷ Nguyên Siêu Tính Toán Mới, Vera Rubin Trở Thành Người Thay Đổi Cuộc Chơi Trong Lĩnh Vực AI

2026-03-16 16:07:57

Jensen Huang một lần nữa xuất hiện trên sân khấu CES, người đứng đầu của NVIDIA đã trình diễn một buổi ra mắt công nghệ hoành tráng, thể hiện hướng đi tương lai của tính toán AI cho toàn ngành công nghiệp. Khác với những năm trước, điểm nhấn năm nay không phải là card đồ họa tiêu dùng truyền thống, mà là một nền tảng siêu máy tính doanh nghiệp nặng 2,5 tấn, tích hợp 6 chip tùy chỉnh – Vera Rubin. Tên gọi này lấy cảm hứng từ nhà thiên văn học Vera Rubin, tượng trưng cho NVIDIA tiếp tục khám phá những giới hạn mới trong vũ trụ AI.

Logic thiết kế chip của Vera Rubin, đổi mới hệ thống đằng sau sự tăng trưởng về hiệu năng

Trong phương pháp phát triển truyền thống, NVIDIA thường tuân theo chiến lược bảo thủ là “mỗi thế hệ chỉ đổi mới 1-2 chip”. Nhưng Vera Rubin đã phá vỡ quy tắc này, thiết kế và sản xuất hàng loạt 6 chip mới cùng lúc, một bước đi chưa từng có trong ngành. Jensen Huang gọi đó là “thiết kế hợp tác tối đa” – đồng bộ đổi mới ở mọi cấp độ của kiến trúc chip và nền tảng tổng thể.

6 chip này đảm nhiệm các chức năng riêng biệt: CPU Vera sử dụng kiến trúc Olympus tùy chỉnh của NVIDIA với 88 lõi, có bộ nhớ hệ thống 1,5TB (gấp 3 lần so với thế hệ Grace trước đó), chỉ riêng điểm này đã đủ để xử lý các ứng dụng AI phức tạp hơn; GPU Rubin là trung tâm hiệu năng, khả năng suy luận đạt 50 PFLOPS, gấp 5 lần thế hệ Blackwell trước, trong khi số lượng transistor chỉ tăng 1,6 lần, thể hiện rõ hiệu quả thiết kế vượt bậc.

Ngoài hai “bộ não” này, Vera Rubin còn tích hợp card mạng ConnectX-9, đơn vị xử lý dữ liệu BlueField-4, chip chuyển đổi NVLink-6 và chip quang Ethernet Spectrum-6. Mỗi chip đều được gia công tỉ mỉ, đảm bảo toàn bộ hệ thống vận hành như một sinh thể thống nhất, phối hợp nhịp nhàng.

Theo các chỉ số hiệu năng thực tế, hệ thống NVL72 tích hợp kiến trúc Vera Rubin đạt khả năng tính toán 3,6 EFLOPS trong các nhiệm vụ suy luận, tăng gấp 5 lần so với thế hệ Blackwell; hiệu năng huấn luyện đạt 2,5 EFLOPS, tăng 3,5 lần. Đặc biệt, mức tăng hiệu năng này đi kèm với việc số transistor chỉ tăng 1,7 lần, cho thấy NVIDIA đã có bước đột phá lớn trong công nghệ bán dẫn và tối ưu kiến trúc.

Tiến bộ về thiết kế vật lý cũng rất ấn tượng. Trước đây, các nút siêu máy tính cần tới 43 dây cáp, mất 2 giờ lắp ráp và dễ gặp lỗi; còn nút Vera Rubin hoàn toàn không cần dây cáp, chỉ dựa vào 6 ống dẫn làm mát bằng dung dịch, thời gian lắp đặt rút ngắn còn 5 phút. Mạng lưới chính NVLink phía sau nút này gồm gần 3.200 km dây đồng và 5.000 cáp đồng, truyền dữ liệu với tốc độ 400Gbps, độ phức tạp của kỹ thuật khiến Jensen Huang đùa rằng “chắc phải là CEO cực kỳ khỏe mạnh mới có thể vận chuyển nổi”.

Cách mạng bộ nhớ và tăng tốc mạng, giải quyết các điểm nghẽn then chốt của AI

Một trong những vấn đề lớn của ứng dụng AI là bộ nhớ ngữ cảnh không đủ lớn. Khi các mô hình AI thực hiện nhiệm vụ đối thoại, chúng tạo ra “KV Cache” – bộ nhớ làm việc của AI. Khi số vòng đối thoại tăng lên và quy mô mô hình mở rộng, bộ nhớ HBM (bộ nhớ băng thông cao) truyền thống nhanh chóng cạn kiệt.

Giải pháp của Vera Rubin là triển khai đơn vị xử lý BlueField-4 để quản lý KV Cache độc lập. Mỗi nút có 4 BlueField-4, mỗi cái đi kèm 150TB bộ nhớ ngữ cảnh, nghĩa là mỗi GPU có thể mở rộng thêm 16TB bộ nhớ – trong khi GPU thông thường chỉ có khoảng 1TB bộ nhớ tích hợp, con số này là bước nhảy mang tính cách mạng. Quan trọng hơn, việc mở rộng này không làm giảm tốc độ truy cập, băng thông 200Gbps vẫn được duy trì.

Tuy nhiên, chỉ có bộ nhớ chưa đủ, khi bộ nhớ làm việc cần phối hợp giữa hàng chục máy chủ, hàng vạn GPU, hạ tầng mạng trở thành điểm nghẽn mới. Spectrum-X ra đời, là nền tảng Ethernet chuyên dụng cho AI đầu tiên của NVIDIA. Nó sử dụng công nghệ TSMC COOP, tích hợp quang tử silicon, hỗ trợ truyền dữ liệu 512 kênh × 200Gbps.

Về mặt kinh tế, đối với các trung tâm dữ liệu hàng nghìn tỷ đô la đầu tư 50 tỷ USD, Spectrum-X có thể tăng khả năng truyền tải lên tới 25%, tiết kiệm khoảng 500 triệu USD – Jensen Huang mô tả hệ thống mạng này là “gần như miễn phí”.

Ngoài ra, Vera Rubin còn chú trọng đến an toàn tính toán. Tất cả dữ liệu trong quá trình truyền, lưu trữ và tính toán đều được mã hóa, bao gồm các kênh PCIe, NVLink, giao tiếp CPU-GPU và các bus khác. Các doanh nghiệp có thể yên tâm triển khai mô hình của riêng mình ra hệ thống bên ngoài mà không lo rò rỉ dữ liệu.

Xu hướng mã nguồn mở và dân chủ hóa AI, mô hình thế hệ mới định hình lại hệ sinh thái ngành

Một điểm đáng chú ý trong buổi ra mắt là Jensen Huang thể hiện sự nhiệt huyết với cộng đồng AI mã nguồn mở. Ông nhấn mạnh việc ra mắt DeepSeek V1 năm ngoái đã tạo ra cú sốc toàn cầu, gọi đó là “mô hình suy luận mã nguồn mở đầu tiên” đã thúc đẩy làn sóng sáng tạo trong ngành. Trên slide trình chiếu, các mô hình mã nguồn mở của Trung Quốc như Kimi và DeepSeek V3.2 lần lượt đứng đầu và thứ hai toàn cầu.

Jensen Huang thừa nhận, hiện tại các mô hình mã nguồn mở còn chậm hơn các giải pháp hàng đầu của ngành khoảng nửa năm, nhưng cứ mỗi nửa năm lại có mô hình đột phá mới ra đời. Tốc độ này khiến các startup, các tập đoàn công nghệ và viện nghiên cứu không dám lơ là, NVIDIA cũng hiểu rõ rằng không thể bỏ lỡ cuộc đua này.

Vì vậy, NVIDIA không còn chỉ đóng vai trò nhà sản xuất chip nữa. Họ đã xây dựng hệ thống siêu máy tính DGX Cloud trị giá hàng tỷ USD, phát triển các mô hình mới như La Proteina – mô hình tổng hợp protein, OpenFold 3 và các ứng dụng tiên tiến khác, đồng thời mở rộng hệ sinh thái mã nguồn mở tập trung vào y học, vật lý AI, trí tuệ nhân tạo, robot và tự hành.

Dòng mô hình Nemotron cũng là điểm sáng, bao gồm các lĩnh vực như giọng nói, đa phương tiện, tăng cường truy xuất và bảo mật. Những mô hình này đã thể hiện xuất sắc trên nhiều bảng xếp hạng uy tín và đã bắt đầu được nhiều doanh nghiệp ứng dụng thực tế.

Hiện thân vật lý AI Alpamayo, thời đại suy luận của tự hành

Nếu nói rằng các mô hình ngôn ngữ lớn giải quyết vấn đề “thế giới số”, thì tham vọng của Jensen Huang tiếp theo là chinh phục “thế giới vật lý”. Ông đề xuất kiến trúc “ba trung tâm tính toán” để thúc đẩy phát triển AI vật lý: máy tính huấn luyện (dựa trên hệ thống GPU truyền thống), máy tính suy luận (triển khai tại biên của robot hoặc xe tự hành như “não nhỏ”), và máy tính mô phỏng (cung cấp môi trường huấn luyện ảo qua Omniverse và Cosmos).

Sản phẩm cụ thể của kiến trúc ba tầng này chính là Alpamayo – hệ thống tự hành đầu tiên trên thế giới có khả năng tư duy do NVIDIA chính thức ra mắt. Khác với tự hành dựa trên quy tắc truyền thống, Alpamayo là hệ thống học sâu toàn diện, giải quyết vấn đề “đuôi dài” của tự hành.

Khi xe gặp các tình huống đường phức tạp chưa từng có, Alpamayo không chỉ thực thi các lệnh lập trình sẵn, mà còn có khả năng suy luận và ra quyết định như người lái xe. Thậm chí, hệ thống còn “bảo bạn biết nó sắp làm gì và tại sao lại làm như vậy”. Trong buổi trình diễn trực tiếp, chiếc xe tự hành này thể hiện khả năng đáng kinh ngạc, có thể phân tích các tình huống giao thông phức tạp thành các kiến thức nền tảng để xử lý.

Mercedes CLA trở thành chiếc xe thương mại đầu tiên ứng dụng công nghệ Alpamayo. Jensen Huang tuyên bố, mẫu xe này sẽ chính thức ra mắt tại Mỹ trong quý I năm nay, sau đó sẽ lần lượt mở bán tại châu Âu và châu Á. Chiếc xe còn đạt điểm an toàn cao nhất của NCAP, nhờ vào “lớp an toàn kép” đặc biệt do NVIDIA thiết kế – khi mô hình AI toàn diện không tự tin về tình hình đường phố, hệ thống sẽ tự động chuyển sang chế độ an toàn truyền thống, đảm bảo an toàn tuyệt đối.

Hệ sinh thái robot và tương lai công nghiệp, mở rộng từ thế giới ảo đến sản xuất thực

Một điểm nhấn khác của buổi ra mắt là chiến lược robot. NVIDIA đã mời nhiều đối tác trình diễn robot, bao gồm robot humanoid và robot bốn chân của Boston Dynamics. Jensen Huang nhấn mạnh, tất cả robot đều sẽ trang bị đơn vị tính toán nhỏ Jetson, được huấn luyện trong môi trường mô phỏng Isaac của Omniverse.

Tầm nhìn lớn hơn là NVIDIA đang tích hợp hệ sinh thái này vào các phần mềm công nghiệp của các ông lớn như Synopsys, Cadence, Siemens. Theo Jensen Huang, robot lớn nhất chính là chính nhà máy.

Từ dưới lên trên, tương lai của NVIDIA là: thiết kế chip, thiết kế hệ thống, mô phỏng nhà máy đều sẽ được thúc đẩy bởi AI vật lý. Buổi trình diễn còn có sự xuất hiện bất ngờ của robot Disney, Jensen Huang đùa rằng, “Các bạn sẽ được thiết kế trong máy tính, chế tạo trong máy tính, thậm chí trước khi chịu lực thật sự, đã được kiểm nghiệm và chứng nhận trong máy tính rồi”.

Nếu chỉ xem phần sau của buổi ra mắt, người ta có thể nhầm đây là buổi giới thiệu sản phẩm của một công ty robot hoặc mô hình AI nào đó.

Từ nhà cung cấp chip đến nhà cung cấp năng lực AI, chiến lược chuyển đổi của Jensen Huang

Trong bối cảnh tranh luận về bong bóng AI, chiến lược của Jensen Huang trong buổi ra mắt này mang nhiều ý nghĩa sâu xa. Ngoài việc Moore’s Law chậm lại khiến các hướng tối ưu hiệu năng truyền thống gặp khó, ông còn muốn chứng minh giá trị thực của AI qua nền tảng Vera Rubin – từ việc nâng cấp sức mạnh tính toán đến ứng dụng thực tế.

Chuyển hướng chiến lược này không chỉ dừng lại ở phần cứng. NVIDIA còn bắt đầu đầu tư mạnh vào tầng ứng dụng và hệ sinh thái – từ việc hỗ trợ mô hình mã nguồn mở, xây dựng DGX Cloud, đến phát triển các mô hình tự hành Alpamayo, các mô hình vật lý AI, đều dùng các sản phẩm và ví dụ thực tế để kể câu chuyện AI thực sự có thể thay đổi thế giới.

Điểm cuối cùng thú vị là, do giới hạn thời gian tại CES, Jensen Huang còn chuẩn bị nhiều slide chưa kịp trình bày. Ông đã làm một video hài hước tổng hợp các nội dung chưa thể trình chiếu trực tiếp, một lần nữa thể hiện phong cách cá nhân của nhà lãnh đạo ngành – vừa nghiêm túc về đổi mới công nghệ, vừa thoáng đãng về phát triển ngành công nghiệp.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

1 thích