NVIDIA ha presentado un nuevo producto llamado supercomputadora NVIDIA DGX-2, que consiste básicamente en 16GPU de Volta apiladas mediante NVSwitch, que es básicamente una interconexión externa de alto rendimiento. Todo el paquete tiene un consumo de energía que es una fracción de lo que tradicionalmente se obtendría usando clusters basados en CPU pero, por supuesto, tiene una prima.
NVIDIA DGX-2: rack de servidor con 16 GPU Volta y Dual Xeon Platinums por $399,000
Tenga en cuenta que llamar a este servidor rack una GPU es un nombre inapropiado. Si bien el uso de NVSwitch de hecho hace que sea mucho más rápido que un rack de servidor con 16 GPU Volta en una configuración vanilla, todavía no es lo suficientemente rápido como lo sería una GPU de este calibre. El servidor incluye un total de 81.920 núcleos CUDA con memoria HBM2 de 512GB y un ancho de banda agregado de 14.4TB/s y GPU de 300GB/s para GPU. El consumo total de energía del bastidor es de 10,000 vatios y pesa 350 libras.
Los conectores 8x EDR 100 Gigabit Ethernet compensan la conectividad y el clúster GPU es impulsado por 2x Xeon Platinums que, si es el 8180, incluiría un total de 56 núcleos, más que suficiente para manejar el asiento del conductor. 1.5TB de RAM también se incluye con 30 TB de NVME SSD. La tela de interconexión utilizada es perfecta y puede funcionar en ambos sentidos, por lo que definitivamente no se trata simplemente de 16 GPU Volta conectadas. Es más que eso, pero aún no es una GPU completa. Puede comprar el DGX-2 por $ 399,000 (de hecho, el DGX-2 es 500 veces más rápido que el 2x GTX 580 pero también es 399 veces más costoso).
La NVIDIA DGX2 es 500 veces más rápida que un par de GTX 580 (y 399 veces más costosa).
DGX-2 es el primer sistema para presentar NVSwitch, que permite que las 16 GPU del sistema compartan un espacio de memoria unificado. Los desarrolladores ahora tienen el poder de entrenamiento de aprendizaje profundo para abordar los conjuntos de datos más grandes y los modelos de aprendizaje profundo más complejos.
Combinado con un conjunto totalmente optimizado y actualizado de software de aprendizaje profundo NVIDIA, el DGX-2 está especialmente diseñado para científicos de datos que impulsan los límites externos de la investigación y la informática de aprendizaje profundo.
DGX-2 puede entrenar FAIRSeq, un modelo de traducción automática neuronal de vanguardia, en menos de dos días: una mejora de 10 veces en el rendimiento de la DGX-1 con Volta, presentado en septiembre.
DGX-2 es la última incorporación al portafolio de productos NVIDIA DGX, que consta de tres sistemas diseñados para ayudar a los científicos de datos a desarrollar, probar, implementar y escalar nuevos modelos de aprendizaje profundo e innovaciones rápidamente.
DGX-2, con 16 GPU, es la parte superior de la alineación. Se une al sistema NVIDIA DGX-1, que presenta ocho GPU Tesla V100, y DGX Station ™, el primer supercomputador personal de aprendizaje profundo del mundo, con cuatro GPU Tesla V100 en un diseño compacto y de escritorio. Estos sistemas permiten a los científicos de datos escalar su trabajo de los complejos experimentos que realizan en sus escritorios a los mayores problemas de aprendizaje profundo, lo que les permite hacer el trabajo de sus vidas.
Se puede obtener más información, incluidas especificaciones técnicas detalladas y formularios de pedido, en https://nvda.ws/2IRilLe.