Nvidia menjual DGX Spark, superkomputer AI pribadi pertamanya

  • DGX Spark adalah "superkomputer pribadi" seukuran mini-PC yang mampu memberikan hingga 1 petaFLOP dan menjalankan 200.000 miliar parameter LLM secara lokal.
  • Ponsel ini mengintegrasikan superchip GB10 Grace Blackwell dengan CPU Arm 20-inti dan memori terpadu LPDDR5X 128 GB, serta SSD NVMe hingga 4 TB.
  • Ponsel ini menjalankan OS DGX (berbasis Ubuntu) dan menyertakan tumpukan perangkat lunak AI Nvidia; daya maksimum sekitar 240 W, WiFi 7, BT 5.4, dan jaringan 10 GbE.
  • Dengan harga $3.999 dan tersedia mulai 15 Oktober; unit pertama dikirim ke Elon Musk dan perusahaan dalam ekosistem.

Superkomputer Pribadi AI

Dengan format yang mengingatkan pada PC mini, Nvidia telah menghadirkan DGX percikan, sebuah tim yang didefinisikan oleh merek sebagai yang pertama superkomputer pribadi untuk kecerdasan buatanTujuannya jelas: untuk membawa ke meja pengembang kekuatan yang sebelumnya diperlukan pusat data atau cloud.

Proposal ini menonjol karena mengizinkan inferensi dan penyesuaian model lokal, dengan angka yang tidak biasa untuk desktop yang dicolokkan ke stopkontak konvensional. Menurut Nvidia, dalam presisi yang dikurangi untuk AI (FP4), ia menawarkan hingga 1 petaFLOP kinerja, cukup untuk melayani model dengan 200.000 miliar parameter tanpa meninggalkan rumah, laboratorium atau kantor.

Apa itu DGX Spark dan untuk siapa?

DGX Spark bukanlah PC konsumen atau rig game; ini adalah alat pengembangan. Ini bekerja dengan Sistem Operasi DGX (varian Ubuntu dengan perangkat lunak AI Nvidia yang sudah terinstal) dan ditujukan untuk peneliti, pengembang dan mahasiswa yang perlu bereksperimen, menyempurnakan, dan memvalidasi proyek di lingkungan mereka sendiri.

Filosofi penggunaannya sederhana: dari peralatan biasa Anda menggunakan aplikasi tradisional dan, ketika AI dibutuhkan, Anda mendelegasikan beban ke DGX Spark melalui jaringan lokal. Dengan cara ini Anda menghindari ketergantungan awan, latensi dan biaya variabel, mempertahankan kontrol atas data dan model.

Tim kompak untuk AI lokal

Arsitektur dan spesifikasi utama

Jantung dari tim adalah GB10 Grace Blackwell, sebuah superchip yang menggabungkan CPU dan GPU di bawah satu atap untuk memaksimalkan koherensi memori dan mengurangi kemacetan. CPU menggabungkan 20 inti lengan (10 Cortex-X925 berkinerja tinggi dan 10 Cortex-A725 yang efisien), dengan Memori terpadu LPDDR128X 5GB yang mencegah transfer data antara RAM dan VRAM.

Dalam penyimpanan, sistem mendukung SSD NVMe M.2 hingga 4 TB dengan enkripsi mandiri, dan konektivitas termasuk WiFi 7, Bluetooth 5.4, red 10 GbE, HDMI y empat USB-CDaya maksimumnya sekitar 240 W, yang membantu menjaga format kompak dan kebisingan yang terkendali, yang agak rumit pada stasiun dengan GPU diskret kelas atas.

Plataforma sedang dipersiapkan untuk tautan berkecepatan tinggi dan kemampuan jaringan seperti HubungkanX-7, dirancang untuk skenario pengembangan tingkat lanjut. Dalam praktiknya, sasis dapat ditempatkan di desktop apa pun dan, dengan berat sekitar 1,2 kg, mudah untuk dipindahkan antar ruangan atau tempat.

Kinerja AI lokal

Bekerja di FP4, DGX Spark mencapai sekitar 1 petaFLOP, sebuah angka yang menempatkannya di antara stasiun kerja kompak dan server laboratorium kecil. Dengan kapasitas sebesar ini, ia mampu melayani kebutuhan lokal LLM hingga 200B parameter, sesuatu yang sampai sekarang dilarang di cloud atau peralatan yang jauh lebih besar.

Untuk proyek yang lebih besar dari ukuran tersebut, Nvidia mencatat bahwa hal itu mungkin menghubungkan dua sistem Spark dan menangani model yang lebih besar, dengan referensi hingga 405.000 miliar parameterSelain itu, perusahaan memastikan kompatibilitas dengan model DeepSeek, Meta, NVIDIA, Google, Qwen dan secara umum dengan alternatif open source yang dapat beradaptasi dengan lingkungan.

Ekosistem dan versi pabrikan

Selain model resmi Nvidia, platform ini akan menghadirkan peralatan dari merek seperti Acer, Asus, Dell, Gigabyte, HP, Lenovo dan MSI, yang akan diluncurkan versi mereka sendiri dengan fondasi yang sama. Perusahaan juga telah mengumumkan keberadaan sistem desktop yang lebih besar bagi mereka yang membutuhkan lebih banyak memori dan ekspansi, dan mempertahankan opsi katalognya seperti Stasiun DGX untuk skenario skala yang lebih besar.

Hal ini patut ditegaskan: Ini bukan PC Windows dan tidak berorientasi pada permainan. Nilainya ada di membuat prototipe, menyempurnakan, dan menyimpulkan dengan AI lokal, dan mampu membawa pekerjaan itu ke cloud atau pusat data saat proyek berkembang.

Harga dan ketersediaan

Nvidia mengonfirmasi harga Dolar AS 3.999 (tentang euro 3.451 sebelum pajak) dan ketersediaan dari Oktober 15 di situs web mereka. Harganya mungkin tidak murah bagi banyak orang, tetapi untuk profil profesional tertentu mungkin sepadan. penghematan pada langganan dan peningkatan dalam privasi dan waktu respons.

Unit pertama dan adopsi awal

Perangkat ini sudah mulai beredar di kalangan mitra dan pakar industri. Jensen Huang secara pribadi mengirimkan unit ke Elon Musk di fasilitas SpaceX, sebuah gerakan yang mengingatkan pada pengiriman pertama DGX-1 pada tahun 2016 ke OpenAI. Secara paralel, organisasi seperti Anaconda, Cadence, Google, Hugging Face, LM Studio, Meta o Microsoft Mereka sedang menguji sistem dan mengadaptasinya model dan alat untuk penyebaran lokal.

DGX Spark tentang daya pusat data ke format desktop, dengan ekosistem perangkat lunak yang matang dan mitra perangkat keras di belakangnya. Bagi mereka yang harus bekerja dengan model besar, kemungkinan beroperasi secara lokal tanpa ketergantungan cloud dapat membuat perbedaan dalam biaya, kontrol, dan kelincahan.

Nvidia
Artikel terkait:
Nvidia dan pertarungan global untuk kecerdasan buatan: tantangan, persaingan, dan pasar Tiongkok

Ikuti kami di Google Berita