Компактный суперкомпьютер NVIDIA DGX Spark с ИИ 128Гб LPDDR5, 4Тб SSD
Технические характеристики
| GPU: | Архитектура NVIDIA Blackwell с тензорными ядрами 5-го поколения и ядрами реального времени 4-го поколения. |
|---|---|
| Процессор: | 20-ядерный процессор Arm (10 ядер Cortex-X925 + 10 ядер Cortex-A725) |
| Память: | 128 ГБ унифицированной системной памяти LPDDR5x, 256-битный интерфейс, 4266 МГц, пропускная способность 273 ГБ/с. |
| Хранилище: | NVMe M.2 4 ТБ с самошифрованием |
| Сеть: | 1x RJ-45 (10 Гбит/с), сетевой адаптер ConnectX-7 Smart NIC, Wi-Fi 7, Bluetooth 5.4 |
| Подключение: | 4 порта USB Type-C, 1 порт HDMI 2.1a, многоканальный звук HDMI. |
| Обработка видео: | 1x NVENC, 1x NVDEC |
| Тип корпуса : | Малый форм-фактор (SFF) |
| Габариты : | 150 мм (Д) x 150 мм (Ш) x 50,5 мм (В) |
| Вес : | 1,2 кг (2,6 фунта) |
| Система охлаждения: | интегрированная система терморегулирования. |
| Идеальная рабочая температура: | от 5°C до 30°C (от 41°F до 86°F) |
| Рабочая влажность: | 10% до 90% (без конденсации) |
| Рабочая высота: | До 3000 метров (9843 фута) |
| Разъемы задней панели: | |
| - | Кнопка питания |
| - | 4 разъема USB Type-C (один для подачи питания) |
| - | 1x HDMI 2.1a разъем для подключения дисплея |
| - | 1x разъем Ethernet RJ-45 (10 Гбит/с) |
| - | 2 сетевых разъема QSFP (ConnectX-7) |
| Поддержка моделей: | модели ИИ с количеством параметров до 200 миллиардов. |
| Производительность тензоров: | тензорные ядра 5-го поколения с поддержкой FP4 |
| Поддержка фреймворков: | PyTorch, TRT-LLM и другие фреймворки для искусственного интеллекта. |
| Примеры применения: | вывод, развертывание и тонкая настройка больших языковых моделей. |
| Источник питания: | внешний блок питания мощностью 240 Вт (входит в комплект). |
| Расчетная тепловая мощность (TDP) SOC: | по стандарту GB10 составляет 140 Вт. |
| Мощность 100 Вт: | доступна для других компонентов системы (ConnectX-7, Wi-Fi, SSD, USB-C и т. д.). |
| Требования к использованию : | Для оптимальной работы требуется использовать прилагаемый блок питания мощностью 240 Вт. Использование другого блока питания или блока питания с меньшей мощностью может привести к снижению производительности системы, невозможности загрузки или неожиданным выключениям. |
| Входное напряжение: | стандартное входное напряжение переменного тока. |
| ОС: | работает под управлением NVIDIA DGX OS, дистрибутива Linux на основе Ubuntu, оптимизированного для задач искусственного интеллекта. |
Описание
DGX Spark, ранее известный как Project DIGITS — это компактный суперкомпьютер, разработанный специально для искусственного интеллекта. В отличие от традиционных рабочих станций или серверов для ИИ, DGX Spark весит всего 1,2 кг и потребляет не более 170 Вт энергии.
Ключевая особенность DGX Spark — возможность локальной работы с крупными моделями ИИ без необходимости подключения к дата-центру. Это решает одну из главных проблем современных разработчиков: зависимость от облачных сервисов, которые могут быть дорогими, медленными или недоступными в определенных регионах.
Но благодаря DGX Spark исследователи, студенты и энтузиасты могут экспериментировать с ИИ прямо у себя дома или в офисе, работая даже с последними моделями ИИ для рассуждений, включая NVIDIA Cosmos Reason и NVIDIA GR00T N1 для роботов.
Более того, NVIDIA позиционирует DGX Spark как часть экосистемы, которая позволяет плавно переносить модели с настольного компьютера в облако DGX Cloud или любую другую ускоренную облачную инфраструктуру практически без изменения кода. Это создает совершенно новую парадигму разработки ИИ, где локальное прототипирование и облачное развертывание становятся частями единого процесса.
В сердце DGX Spark лежит NVIDIA GB10 Grace Blackwell Superchip — уникальный процессор, объединяющий мощный GPU, построенный на базе архитектуры Blackwell с тензорными ядрами пятого поколения и поддержкой вычислений пониженной точности FP4*, и 20-ядерный Arm-процессор, состоящий из 10 ядер Cortex-X925 и 10 ядер Cortex-A725. Этот чип оптимизирован специально для компактного форм-фактора, но при этом отличается впечатляющей производительностью.
FP4 (4-битный формат с плавающей запятой) - это формат вычислений пониженной точности, который значительно увеличивает производительность и снижает использование памяти при сохранении достаточной точности для AI-задач
Во многом этому способствует использование технологии NVIDIA NVLink-C2C, которая объединяет память CPU и GPU в единую систему. В традиционных компьютерах процессор и видеокарта работают с отдельными областями памяти, и это тормозит работу и усложняет программирование. NVLink-C2C решает эту проблему. В результате скорость передачи данных по этому каналу достигает 900 ГБ/с, что в 5 раз быстрее, чем у PCIe пятого поколения. А время отклика снижается до менее чем 20 наносекунд против 400-600 наносекунд у PCIe.
Кроме того, в DGX Spark устанавливается 128 ГБ объединенной памяти LPDDR5x как у новых Mac mini с M4 с пропускной способностью 273 ГБ/с и накопителем NVMe SSD емкостью до 4 ТБ.
А для подключения внешних устройств предусмотрены:
- четыре порта USB4
- порт HDMI 2.1a
- 10-гигабитный Ethernet (ConnectX-7 Smart NIC)
- Wi-Fi 7
- Bluetooth 5.4
В совокупности такой сетап позволяет DGX Spark достигать производительности до 1000 TOPS при работе с моделями искусственного интеллекта. Это сопоставимо с производительностью некоторых серверных решений, которые занимают целую стойку и потребляют киловатты электроэнергии.
Система поставляется с предустановленной операционной системой NVIDIA DGX OS, которая представляет собой модифицированный Ubuntu Linux с интегрированными драйверами и инструментами NVIDIA. Она обеспечивает доступ к полному стеку ИИ-технологий NVIDIA, включая CUDA-X AI, микросервисы NIM и платформу NVIDIA AI Enterprise.
Объедините два DGX Spark в единую кластер – и получите вдвое более мощную машину А при необходимости пару DGX Spark даже можно объединить в единый кластер. NVIDIA официально поддерживает конфигурацию из двух устройств, соединенных через двухпортовый сетевой адаптер NVIDIA ConnectX-7, который обеспечивает скорость передачи данных до 200 Гбит/с с поддержкой RDMA. Таким образом можно масштабировать вычислительные ресурсы для еще более сложных задач.












