Un servidor de GPU dedicado es un servidor con una o m¨¢s unidades de procesamiento de gr¨¢ficos (GPU) que ofrece mayor potencia y velocidad para ejecutar tareas computacionalmente intensivas, como renderizaci¨®n de video, an¨¢lisis de datos y aprendizaje autom¨¢tico. Los servidores GPU dedicados tambi¨¦n pueden tener una CPU especializada y vienen con grandes cantidades de RAM y almacenamiento.
La arquitectura paralela de una GPU , originalmente dise?ada para manejar el procesamiento de gr¨¢ficos y videos, permite que un servidor de GPU dedicado administre varias tareas simult¨¢neamente a velocidades m¨¢s all¨¢ de las capacidades de un servidor basado en CPU.
?Qu¨¦ es un servidor en rack con GPU?
Un servidor de rack de GPU es un servidor equipado con GPU dise?adas para caber en un rack de servidor. Un rack de servidor es un marco rectangular con varias ranuras de montaje dise?adas para contener servidores de rack y otros componentes de red. Los servidores se apilan uno encima del otro para minimizar el uso del espacio del piso y se deslizan hacia adentro y hacia afuera del rack seg¨²n sea necesario.
Un servidor de rack con GPU ofrece varias ventajas, entre ellas, una mejor utilizaci¨®n del espacio, una mayor escalabilidad, un flujo de aire maximizado y un mantenimiento m¨¢s sencillo.
Razones para usar un servidor de GPU dedicado
Las GPU son las contrapartes especializadas y optimizadas para el rendimiento de las CPU. En lugar de tener un pu?ado de n¨²cleos pesados con altas velocidades de reloj capaces de realizar una amplia variedad de tareas computacionales, las GPU emplean miles de n¨²cleos livianos optimizados para procesar la misma operaci¨®n en paralelo (es decir, instrucci¨®n ¨²nica, datos m¨²ltiples [SIMD]).
Estos n¨²cleos tienen conjuntos de instrucciones optimizados para c¨¢lculos de matriz dimensional aritm¨¦tica y punto flotante, lo que acelera el ¨¢lgebra lineal. El resultado final es un sistema optimizado para la computaci¨®n en paralelo.
Entre las razones por las que podr¨ªa querer usar un servidor de GPU dedicado se incluyen las siguientes:
- Procesos de an¨¢lisis de Big Data
- Transmisi¨®n de video
- Procesamiento de im¨¢genes
- Animaciones y simulaciones en 3D (p. ej., el modelado del plegamiento de la cadena de prote¨ªnas)
- Aplicaciones de aprendizaje profundo (p. ej., reconocimiento de voz)
- Descifrado de hash (p. ej., recuperaci¨®n de contrase?a)
- Criptomoneda de miner¨ªa
Si tiene una sola operaci¨®n, necesita una aceleraci¨®n que pueda beneficiarse de la ejecuci¨®n paralela en miles de n¨²cleos, un servidor de GPU dedicado puede ayudarlo.
Tipos de servidores en rack con GPU
Los servidores de rack con GPU se adaptan a los servidores de rack o gabinetes. Los racks de servidores y el equipo instalado en ellos se miden en unidades de rack, escritas como ¡°U¡± o, a veces, ¡°RU¡±. Una ¡°U¡± describe la altura del equipo (p. ej., la altura de un servidor o la altura y el n¨²mero de estantes en un rack de servidores).
Una U equivale a 1,75 pulgadas, por lo que la altura de un servidor 1U ser¨ªa de 1,75 pulgadas y un servidor 2U ser¨ªa de 3,5 pulgadas. Una unidad de rack de 32U, por ejemplo, puede contener 32 servidores 1U, 4 servidores 8U o 1 servidor 32U.
Lea ¡°Una gu¨ªa definitiva sobre los tama?os de rack de servidores 19-Inch¡± para obtener m¨¢s informaci¨®n sobre el tama?o de rack.
Factores de forma m¨¢s peque?os frente a factores de forma m¨¢s grandes
Las principales diferencias entre los factores de forma de los servidores de rack m¨¢s peque?os y m¨¢s grandes son su densidad y capacidad de expansi¨®n.
Servidores de rack con GPU de 1U y 2U
Los factores de forma m¨¢s peque?os, como los servidores en rack de GPU de 1U y 2U, est¨¢n dise?ados teniendo en cuenta la densidad de rendimiento, pero son menos potentes que los factores de forma de servidores de GPU m¨¢s grandes. Se utilizan com¨²nmente debido a sus costos m¨¢s bajos y a su capacidad para ahorrar espacio en el rack del servidor.
Los servidores en rack con GPU de 1U y 2U son f¨¢ciles de mantener, altamente port¨¢tiles y f¨¢ciles de escalar (puede escalar el rendimiento al usar varios de ellos). Un servidor 1U generalmente puede contener una o dos CPU, varios terabytes de memoria y varias GPU. Un servidor de 2U al doble de la altura del servidor de 1U le dar¨¢ un poco de espacio adicional para la potencia de computaci¨®n y el almacenamiento.
En servidores de factor de forma m¨¢s peque?os, las GPU generalmente se montan horizontalmente debido a las restricciones de espacio. Tambi¨¦n hay menos espacio para las ranuras y el almacenamiento PCIe, aunque puede expandirlos con un kit de expansi¨®n PCIe o un gabinete JBOD.
Servidores en rack con GPU de 8U y 16U
Los servidores de rack de GPU m¨¢s grandes, como 8U y 16U, est¨¢n orientados a cargas de trabajo que requieren capacidades de rendimiento m¨¢s extensas. Vienen con m¨¢s espacio para almacenamiento y ranuras de expansi¨®n adicionales, lo que le permite conectar tarjetas PCIe adicionales para aumentar el rendimiento del procesamiento de datos. El espacio adicional tambi¨¦n promueve una mejor circulaci¨®n de aire para evitar el sobrecalentamiento.
En un factor de forma m¨¢s grande, las GPU se instalan verticalmente con espacio adicional para las conexiones de alimentaci¨®n ubicadas en la parte superior de la tarjeta en lugar de en la parte posterior.
C¨®mo dimensionar un servidor de GPU dedicado
Al dimensionar un servidor de GPU dedicado, deber¨¢ considerar las caracter¨ªsticas del producto que desea, as¨ª como sus necesidades comerciales actuales y futuras. La configuraci¨®n ¨®ptima del servidor depende de sus cargas de trabajo objetivo, los casos de uso espec¨ªficos de ese servidor y la rapidez con la que necesita que sea.
Los servidores de GPU dedicados se pueden configurar para cargas de trabajo objetivo espec¨ªficas, como renderizaci¨®n de video, capacitaci¨®n de aprendizaje profundo, inferencia, an¨¢lisis de big data y computaci¨®n de alto rendimiento (HPC). La configuraci¨®n ¨®ptima del servidor depende de sus cargas de trabajo objetivo, los casos de uso espec¨ªficos de ese servidor y la rapidez con la que necesita que sea.
Las GPU usan mucha potencia y generan toneladas de calor. Son m¨¢s grandes que las CPU y necesitan espacio adicional para los conectores de alimentaci¨®n. El chasis del servidor no solo debe ser lo suficientemente grande como para adaptarse a la cantidad de GPU que desea usar, sino que tambi¨¦n debe proporcionar una buena ventilaci¨®n de aire para evitar el sobrecalentamiento y .
?Cu¨¢nto cuesta un servidor de GPU dedicado?
Es comprensible que los costos var¨ªen seg¨²n si elige crear su propio servidor de GPU dedicado, alquilar un servidor o usar servicios basados en la nube.
Si va a crear su propio servidor, deber¨¢ considerar el costo de la GPU, as¨ª como la fuente de alimentaci¨®n, el chasis, la CPU especializada, la RAM y el almacenamiento. Es posible que tambi¨¦n deba considerar los costos que conlleva la construcci¨®n de centros de datos en las instalaciones, como los costos de energ¨ªa, espacio, refrigeraci¨®n y mantenimiento.
Las GPU se clasifican en especializaciones y los precios var¨ªan seg¨²n el caso de uso. Por ejemplo, NVIDIA ofrece servidores V100-based adecuados para el aprendizaje profundo y los c¨¢lculos de alta precisi¨®n. Una , como Nvidia GTX Titan Z de NVIDIA, puede costar alrededor de $3000.
Si elige usar una plataforma en la nube, hay varios proveedores de servicios en la nube que ofrecen planes de servidores basados en GPU dedicados, incluidos los principales proveedores de servicios en la nube como AWS V2 Cloud, Google Cloud Platform y Azure. AWS, por ejemplo, ofrece desde $0,900 por hora para una GPU y cuatro n¨²cleos virtuales.
Servidor en rack de GPU: Compra frente a alquiler
Elegir si comprar o alquilar se reduce a varios factores. El presupuesto de su empresa y los posibles casos de uso son los principales.
Comprar un servidor de rack con GPU implica costos iniciales. Las GPU mejor calificadas para las cargas de trabajo de aprendizaje autom¨¢tico pueden tener un alto precio. Agrega esto a los costos de mantenimiento, energ¨ªa y ancho de banda del almacenamiento de su servidor de GPU en las instalaciones, y sus costos de inversi¨®n iniciales podr¨ªan ser astron¨®micos.
Con el ritmo de las innovaciones tecnol¨®gicas modernas, comprar un servidor de GPU conlleva el riesgo de que se vuelva obsoleto antes de que pueda obtener un retorno sobre su inversi¨®n. La actualizaci¨®n del sistema tambi¨¦n incurrir¨¢ en costos adicionales.?
Si trabaja con grandes conjuntos de datos y planea implementar sus modelos en un entorno de producci¨®n, considere alquilar la infraestructura de GPU a trav¨¦s de un proveedor de servicios en la nube. Este modelo de suscripci¨®n le permite pagar por hora o mensualmente seg¨²n los recursos que utilice y escalar hacia arriba o hacia abajo seg¨²n las demandas actuales.
Obtenga infraestructura de AI de ¨²ltima generaci¨®n con É«¿Ø´«Ã½
Un servidor de GPU dedicado ofrece varias ventajas sobre un servidor basado en CPU, incluido un mayor rendimiento, una mayor flexibilidad y una mejor utilizaci¨®n de los recursos de CPU. Los servidores GPU dedicados se pueden comprar directamente o alquilar a un proveedor de servicios.?
AIRI es una infraestructura de AI simple, altamente escalable y basada en flash desarrollada por É«¿Ø´«Ã½ ? y NVIDIA . AIRI?cuenta con la tecnolog¨ªa de los sistemas NVIDIA DGX m¨¢s recientes con el almacenamiento FlashBlade//S ? de É«¿Ø´«Ã½, el sistema operativo Purity//FB de É«¿Ø´«Ã½ y la administraci¨®n de la nube de Pure1?.
Experimente nuevos niveles de ¨¦xito de AI con Pure y AIRI.