Baru-baru ini saya melihat berita ini, NVIDIA mengakuisisi bisnis inferensi chip Groq pada akhir tahun lalu, dan transaksi ini sebenarnya cukup menarik dari segi logika.



Huang Renxun menjelaskan secara rinci untuk pertama kalinya di konferensi GTC tahun ini mengapa mereka harus mengakuisisi Groq. Singkatnya, mereka melihat pasar inferensi sedang mengalami diferensiasi. Sebelumnya, semua orang hanya fokus pada satu tujuan saat mengoptimalkan chip inferensi: meningkatkan throughput. Tapi sekarang situasinya berbeda, pengguna yang berbeda bersedia membayar harga berbeda untuk kecepatan respons yang berbeda.

Logika di sini sangat penting—jika saya bisa memberikan pengembang kecepatan respons token yang lebih cepat, sehingga meningkatkan efisiensi kerja mereka, mereka akan bersedia membayar untuk itu. Pasar ini, yang bernilai tinggi dan berlatensi rendah, sebenarnya baru muncul belakangan ini. Huang menyebut ini sebagai perluasan Pareto frontier dari pasar inferensi: sebelumnya adalah solusi throughput tinggi, sekarang ditambahkan jalur baru, yaitu solusi berlatensi rendah dan harga satuan tinggi.

Dan Groq kebetulan adalah ahli di bidang ini. Arsitektur LPU mereka terkenal karena latensi rendah yang pasti, yang sangat melengkapi arah throughput tinggi dari GPU NVIDIA. Pada bulan Maret, Groq merilis LPU 3 yang menggunakan proses Samsung 4nm, dan kemampuan inferensi mereka pada model dengan triliunan parameter lebih tinggi 35 kali lipat dibandingkan Blackwell NVL72, perbedaan performa ini benar-benar mencengangkan.

Dari sudut pandang lini produk, akuisisi ini mengisi kekosongan NVIDIA di pasar inferensi. Bayangkan saja, model yang sama, dengan respons waktu yang berbeda, bisa memiliki strategi penetapan harga yang berbeda—meskipun throughput sedikit lebih kecil, harga satuan bisa menutupi kekurangannya. Penambahan Groq membuat NVIDIA memiliki cakupan yang lebih lengkap di pasar inferensi. Dari segi strategi, transaksi ini jelas dan masuk akal.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan