Moor Threads meluncurkan desain referensi supernode berkapasitas tinggi dengan 128 kartu

robot
Pembuatan abstrak sedang berlangsung

Dari: China Business Network

Laporan oleh jurnalis Zhongjing, Li Yuyang, dari Shanghai

Sejak NVIDIA secara resmi merilis solusi super node single-rack NVL72 pada GTC 2024, super node telah menjadi standar utama pusat komputasi pintar, dan ini telah menjadi konsensus industri.

Baru-baru ini, mitra industri seperti Moore Thread, Chinese Mobile Research Institute, dan ZhiJiang Laboratory, berlandaskan platform inovasi kolaboratif OISA, secara resmi merilis “Standar Teknik Referensi Desain Super Node Kepadatan Tinggi OISA”. Standar ini memperkenalkan solusi kabel berukuran besar dan padat, yang berdasarkan interkoneksi antara 32 hingga 64 kartu grafis utama, merealisasikan konektivitas penuh dalam satu kabinet standar dengan 128 kartu, dan mendukung perluasan melalui penggabungan kabinet untuk mencapai 256 kartu.

Pada tingkat protokol inti, berlandaskan dukungan semantik memori asli dari versi OISA 2.0, desain ini memungkinkan akses data tanpa hambatan antar node, dipadukan dengan teknologi rekonstruksi pesan inovatif, yang meningkatkan bandwidth antar kartu hingga tingkat TB/s, dan mengurangi latensi hingga ratusan nanodetik. Diketahui bahwa inovasi ganda dari “ruang fisik padat tinggi + konektivitas logis berkecepatan tinggi” ini tidak hanya mendukung kompatibilitas dan interoperabilitas chip domestik dari berbagai vendor, tetapi juga menyediakan lingkungan komputasi kolaboratif yang mendekati performa satu mesin untuk pelatihan model skala besar.

Menghadapi tantangan berat di mana konsumsi daya satu GPU meningkat hingga di atas 700W, dan daya kabinet berkembang ke tingkat 350kW bahkan lebih tinggi, desain referensi OISA menyelesaikan revolusi dasar dari dua aspek: pasokan daya dan manajemen pendinginan. Di sisi pasokan daya, solusi ini memperkenalkan sistem DC bertegangan tinggi dan pasokan daya terpusat dalam kabinet, serta teknologi plug-and-play buta, yang mengurangi lapisan konversi daya di tengah, secara signifikan menurunkan kehilangan energi. Di sisi pendinginan, teknologi pendinginan cair dari awalnya sebagai “opsi” berubah menjadi “standar asli” dalam arsitektur super node, dengan optimasi mendalam untuk kebutuhan pendinginan GPU tunggal di atas 2kW, menurunkan nilai PUE dari era pendinginan udara yang sekitar 1.4 menjadi antara 1.05 dan 1.15.

(Disunting oleh Wu Qing, Disetujui oleh Li Zhenghao, Diedit oleh Zhai Jun)

Informasi melimpah, interpretasi akurat, semua tersedia di Sina Finance APP

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan