É«¿Ø´«Ã½

Skip to Content
³Ò³Ü¨ª²¹

?Qu¨¦ es HPC Storage? Una gu¨ªa definitiva

El almacenamiento inform¨¢tico de alto rendimiento (o HPC) describe las redes, los sistemas y las arquitecturas de almacenamiento que respaldan las necesidades ¨²nicas de los entornos inform¨¢ticos de alto rendimiento.

?Qu¨¦ es HPC Storage? Una gu¨ªa definitiva

El almacenamiento de computaci¨®n de alto rendimiento (HPC) comprende la red de baja latencia con acceso a datos de alta velocidad que se requiere para los proyectos de HPC. HPC es el uso de computadoras y supercomputadoras agrupadas y conectadas para llevar a cabo tareas complejas en paralelo.?

Pero es m¨¢s que solo la velocidad computacional lo que hace que HPC sea tan significativo. Es la capacidad de HPC para analizar conjuntos de datos masivos de escala de exabyte lo que lo hace responsable de tantos avances modernos. Para llevar a cabo estas tareas complejas, los entornos de HPC exigen soluciones de almacenamiento modernas para cl¨²steres de HPC.?

Adem¨¢s, a medida que convergen la inteligencia artificial (AI ) y la HPC, las empresas tradicionales pueden beneficiarse a¨²n m¨¢s de la comprensi¨®n y la arquitectura de HPC, mientras adoptan la AI . Algunos l¨ªderes empresariales incluso eligen abandonar sus equipos de HPC tradicionales a favor de una infraestructura de AI convergente m¨¢s estable y ¨¢gil que se implementan ellos mismos o a trav¨¦s de socios integradores de sistemas.

Aqu¨ª le mostramos un an¨¢lisis profundo de las demandas de HPC sobre el almacenamiento y c¨®mo se pueden dise?ar las infraestructuras empresariales para respaldarlas.

Art¨ªculos relacionados

Art¨ªculo de conocimiento
?Qu¨¦ es la computaci¨®n de alto rendimiento?

?Qu¨¦ es la computaci¨®n de alto rendimiento?

HPC es el uso de sistemas inform¨¢ticos avanzados (p. ej., supercomputadoras o cl¨²steres de computadoras de alto rendimiento) para procesar tareas complejas en paralelo, generalmente en campos como investigaci¨®n cient¨ªfica, ingenier¨ªa, fabricaci¨®n y ciencias inform¨¢ticas. HPC potencia las simulaciones cient¨ªficas, el modelado, las verificaciones y AI generativa, lo que permite a los investigadores y profesionales analizar conjuntos de datos masivos y resolver problemas complejos de manera eficiente.?

El alcance es un aspecto; el otro es la velocidad. Y cuanto m¨¢s r¨¢pida sea la infraestructura de datos debajo de estos sistemas, m¨¢s r¨¢pidos ser¨¢n los c¨¢lculos.

?Cu¨¢les son los tipos de HPC?

Existen diferentes tipos de computaci¨®n de alto rendimiento para varios casos de uso. Algo que todos tienen en com¨²n: Generan y procesan grandes cantidades de datos. Los tipos m¨¢s comunes de computaci¨®n de alto rendimiento se definen por la forma en que las computadoras trabajan juntas y en qu¨¦ trabajan juntas, entre ellos:

  • ³§³Ü±è±ð°ù³¦´Ç³¾±è³Ü³Ù²¹³¦¾±¨®²Ô: Dise?ado para que a menudo se utilizan en simulaciones cient¨ªficas, modelado clim¨¢tico, gemelos digitales, entornos de realidad aumentada o virtual e investigaci¨®n avanzada.
  • Computaci¨®n en cl¨²ster: Computadoras en red que trabajan en paralelo en tareas distribuidas en varias m¨¢quinas, a menudo utilizadas en instituciones acad¨¦micas y de investigaci¨®n. Los cl¨²steres de computaci¨®n de alto rendimiento (HPC) son una colecci¨®n de computadoras interconectadas de alto rendimiento dise?adas para procesamiento paralelo, a menudo en aplicaciones cient¨ªficas e de ingenier¨ªa.
  • Computaci¨®n distribuida: Se pueden aprovechar varias computadoras conectadas a trav¨¦s de una red cuando los sistemas est¨¢n inactivos, gracias al software que los voluntarios descargan para que sus computadoras est¨¦n disponibles cuando no est¨¢n en uso. Los aprovechan estos sistemas.?
  • Computaci¨®n en la nube: Los servidores remotos almacenan, administran y procesan datos, ofreciendo recursos inform¨¢ticos escalables para varias aplicaciones. Las soluciones de HPC basadas en la nube proporcionan acceso seg¨²n demanda a recursos inform¨¢ticos de alto rendimiento para que los usuarios puedan acceder a la potencia computacional sin grandes inversiones iniciales.
  • Computaci¨®n cu¨¢ntica: Aunque sigue siendo una nueva ¨¢rea de investigaci¨®n y rara vez se usa en la empresa, la computaci¨®n cu¨¢ntica tiene el potencial de realizar c¨¢lculos a gran escala para resolver problemas complejos m¨¢s r¨¢pido que las computadoras cl¨¢sicas.
  • Computaci¨®n acelerada: Usar aceleradores de hardware especializados como unidades de procesamiento de gr¨¢ficos (GPU) y unidades de procesamiento neural (NPU) para mejorar el rendimiento computacional, especialmente en tareas relacionadas con la AI y tambi¨¦n simulaciones del mundo real como gemelos digitales y el omniverso.?

?Los proyectos de AI son similares a los proyectos de HPC?

S¨ª y no. Si bien los proyectos de AI casi siempre aprovechan los recursos de HPC, la mayor¨ªa de los proyectos de HPC no est¨¢n estrictamente relacionados con la AI.

A medida que las empresas buscan reestructurar sus infraestructuras de TI para respaldar nuevos proyectos de AI, las infraestructuras de HPC a menudo se ven como modelos para infraestructuras de AI, si solo porque son similares en alcance y escala. HPC est¨¢ tan cerca como muchas empresas han llegado a construir centros de datos dise?ados para proyectos de este alcance, hardware especializado como GPU, chips y potencia computacional; sin embargo, ambas no son sin¨®nimos.

Los proyectos de AI requieren mucha potencia computacional, aceleradores de hardware y arquitecturas de procesamiento en paralelo, y computaci¨®n en cl¨²steres durante la transformaci¨®n de datos y el entrenamiento de modelos, similar a HPC. Tambi¨¦n aprovechan una variedad de tecnolog¨ªas y m¨¦todos, incluida HPC. (Otros incluyen aprendizaje profundo, visi¨®n por computadora, aprendizaje autom¨¢tico y procesamiento de lenguaje natural).?

HPC puede admitir AI pero tambi¨¦n es m¨¢s amplio. Si bien la AI se centra en modelos y algoritmos para ayudar en la toma de decisiones, el reconocimiento de patrones y el procesamiento del lenguaje (como lo vemos con la AI generativa), los proyectos de HPC pueden aplicarse a una gama m¨¢s amplia de tareas m¨¢s all¨¢ AI, incluidas la ciencia, las simulaciones, la investigaci¨®n, la ingenier¨ªa, el an¨¢lisis de datos y el modelado num¨¦rico.

Tambi¨¦n difieren en la forma en que manejan los datos. AI funciona con grandes conjuntos de datos, necesarios para entrenar modelos. HPC puede y maneja grandes conjuntos de datos, pero su enfoque est¨¢ m¨¢s en los c¨¢lculos que lleva a cabo.?

¡°La HPC rara vez ha estado en el ¨¢mbito de la TI empresarial, por lo general se mantiene dentro de los l¨ªmites acad¨¦micos y de la investigaci¨®n. La mayor¨ªa de las empresas ni siquiera se han abalanzado en HPC, pero incluso para aquellas que lo han hecho, a menudo no se mezcla con otros flujos de trabajo; se trata como un silo y se administra como una bestia diferente¡±. - ?

?La computaci¨®n en la nube es lo mismo que HPC?

No, la computaci¨®n en la nube no es sin¨®nimo de HPC. La computaci¨®n en la nube, como se mencion¨® anteriormente, es m¨¢s un ¡°c¨®mo¡±, ya que proporciona recursos que se pueden aprovechar para proyectos de HPC. En general, la computaci¨®n en la nube es un concepto que define c¨®mo se alojan y entregan los servicios y las infraestructuras, y esto puede incluir HPC.

?Qu¨¦ industrias conf¨ªan en HPC?

Como mencionamos anteriormente, es m¨¢s probable que las organizaciones aprovechen las redes de HPC y los entornos de almacenamiento de HPC en los campos de investigaci¨®n cient¨ªfica, ciencia ambiental, pron¨®stico del clima, ingenier¨ªa aeroespacial y automotriz, servicios financieros, petr¨®leo y gas, fabricaci¨®n y atenci¨®n de la salud, incluida la investigaci¨®n gen¨®mica y las pruebas farmac¨¦uticas.

Sin embargo, HPC no se limita a estos campos y puede beneficiar a cualquier empresa que necesite llevar a cabo c¨®mputos complejos, ejecutar simulaciones con gran cantidad de datos, procesar , o realizar an¨¢lisis de Big Data.

?Qu¨¦ es HPC Storage?

Los entornos de HPC suelen tener tres componentes principales: procesadores inform¨¢ticos, redes y almacenamiento. Una demanda central de los proyectos de HPC es el acceso r¨¢pido a los datos, lo que hace que el almacenamiento sea un componente fundamental para el ¨¦xito de estos entornos.?

Para operar con velocidad y escala, los entornos de HPC requieren arquitecturas modernas de sistemas de archivos con niveles fr¨ªos y calientes y servidores de metadatos de alta disponibilidad. La integraci¨®n de NVMe y almacenamiento de objetos le brinda al sistema HPC la capacidad de satisfacer las demandas de cargas de trabajo modernas con baja latencia y alto ancho de banda.

?C¨®mo funciona el almacenamiento de datos de HPC?

El almacenamiento de datos de HPC funciona descargando datos de CPU, memoria y controladores de almacenamiento de manera r¨¢pida y eficiente, para que las CPU puedan continuar el procesamiento sin interrupci¨®n. La plataforma de datos para un sistema HPC tambi¨¦n debe ser accesible y por niveles, manteniendo los datos calientes cerca de los nodos y accesibles para ellos.

Arquitectura de almacenamiento de HPC: Procesamiento paralelo, cl¨²ster e interconexiones de alta velocidad

Dentro de la computaci¨®n de alto rendimiento, existen tres conceptos fundamentales clave que explican c¨®mo se llevan a cabo las tareas:

  • Procesamiento paralelo: Esto describe c¨®mo las computadoras (o nodos) trabajan juntas para llevar a cabo una tarea. En HPC, los grandes problemas pueden dividirse en tareas m¨¢s peque?as que luego se resuelven con varios procesadores o n¨²cleos de procesamiento a la vez, por lo que HPC es capaz de manejar conjuntos de datos masivos y c¨®mputos tan r¨¢pidamente. Los procesadores pueden manejar las tareas de forma independiente o pueden colaborar en una sola tarea. Sin importar c¨®mo se dividan y conquisten, es clave que suceda en paralelo.
  • Agrupamiento: El cl¨²ster es una arquitectura aprovechada por HPC en la que varios nodos trabajan juntos como uno solo, lo que permite nuevamente que se realice un trabajo paralelo, solo a mayor escala. Tambi¨¦n es una forma de generar confiabilidad en un entorno de HPC. Debido a que los nodos est¨¢n conectados por una red a un sistema unificado y ¨²nico, las tareas se pueden dividir y llevar a cabo, incluso si falla un nodo en la red. Esto incluye organizaci¨®n y programaci¨®n, donde el software administra los recursos de cl¨²ster disponibles y delega de manera inteligente el trabajo al cl¨²ster m¨¢s adecuado.?
  • Interconexiones de alta velocidad: Esto describe la comunicaci¨®n entre nodos en un cl¨²ster, y estos enlaces (p. ej., Ethernet de alta velocidad) son la columna vertebral de la potencia y velocidad de colaboraci¨®n de HPC. Las interconexiones de alta velocidad permiten que la comunicaci¨®n r¨¢pida y el procesamiento en paralelo ocurran de manera r¨¢pida y eficiente entre las computadoras en el cl¨²ster y entre los nodos de almacenamiento y los nodos de procesamiento.

Funciones que debe buscar en HPC Storage

El almacenamiento es cada vez m¨¢s importante en la era de las aplicaciones, big data y HPC. Lo que se necesita es una arquitectura nueva e innovadora para admitir aplicaciones avanzadas y, al mismo tiempo, proporcionar el mejor rendimiento en todas las dimensiones de la concurrencia: IOPS, rendimiento, latencia y capacidad. Idealmente, el almacenamiento HPC ofrece:

  • Una soluci¨®n de almacenamiento flash con un sistema el¨¢stico de escalabilidad horizontal que puede ofrecer un rendimiento basado ¨ªntegramente en tecnolog¨ªa flash a conjuntos de datos a escala de petabytes, ideal para el an¨¢lisis de big data
  • Escala horizontal masiva para permitir operaciones de lectura/escritura simult¨¢neas mientras varios nodos acceden al almacenamiento al mismo tiempo
  • Eficiencia y sencillez para arquitectos de almacenamiento
  • Acceso a datos de alta velocidad. El almacenamiento debe poder manejar solicitudes r¨¢pidas y frecuentes.
  • Redundancia y tolerancia a fallas
  • NVMe para acceso de latencia baja
  • Almacenamiento de objetos para simplificar y satisfacer las necesidades de aplicaciones nativas en la nube

Herramientas avanzadas de administraci¨®n de datos, como , que ayudan a la compresi¨®n y desduplicaci¨®n.

?El almacenamiento de HPC es lo mismo que el almacenamiento en la nube?

Si bien tanto el almacenamiento HPC como el almacenamiento en la nube administran datos, tienen diferencias clave.

  • La nube es general; HPC es espec¨ªfico. El almacenamiento HPC est¨¢ dise?ado para aplicaciones inform¨¢ticas de alto rendimiento, optimizado para un procesamiento paralelo eficiente y un acceso r¨¢pido a los datos. El almacenamiento en la nube ofrece almacenamiento general como servicio para una amplia gama de aplicaciones (incluida HPC).
  • La nube es un modelo operativo. El almacenamiento en la nube es un modelo de servicio para almacenar y administrar datos de forma remota.?
  • HPC est¨¢ sintonizado para el rendimiento . Los servicios de almacenamiento en la nube pueden limitar la cantidad de proyectos de personalizaci¨®n granular necesarios para un rendimiento ¨®ptimo. El almacenamiento de HPC se optimizar¨¢ en cuanto a velocidad y acceso, mientras que la nube favorece m¨¢s la flexibilidad y la escalabilidad.
  • Los modelos de costos de almacenamiento en la nube lo obligan a ¡°comprar¡± m¨¢s capacidad para obtener m¨¢s rendimiento, incluso si no necesita el espacio de almacenamiento adicional.

Cabe destacar que las cargas de trabajo de HPC de la universidad y el centro de investigaci¨®n se trasladan cada vez m¨¢s a la nube, mientras que las cargas de trabajo de HPC comerciales y empresariales siguen estando en las instalaciones. Sin embargo, el costo total de propiedad (TCO) es alto para las cargas de trabajo de HPC basadas en la nube, y la repatriaci¨®n de conjuntos de datos de HPC a las instalaciones o trasladarlos a otro proveedor de la nube tambi¨¦n es costosa.

?Qu¨¦ hace que HPC Storage sea complejo?

La computaci¨®n de alto rendimiento ya es compleja y desafiante, por lo que no es de extra?ar que el entorno de almacenamiento necesario para admitirla tambi¨¦n pueda serlo. Las cargas de trabajo complejas, el alto volumen de datos en el rango de exabytes, los requisitos de seguridad de datos, las integraciones y el nivelado de datos hacen que navegar por HPC sea un negocio complicado. Sin embargo, las soluciones que ofrecen capacidades s¨®lidas y facilidad de uso, como É«¿Ø´«Ã½ ? FlashBlade, pueden manejar e incluso compensar esa complejidad sin agregar cuellos de botella o retrasos.

?El almacenamiento inform¨¢tico de alto rendimiento es bueno para cualquier sistema o red?

Es posible que el almacenamiento de HPC no siempre sea la soluci¨®n m¨¢s rentable para cada sistema o red, ya que no todas las cargas de trabajo requieren un almacenamiento espec¨ªficamente ajustado para los desaf¨ªos de HPC. Sin embargo, a medida que m¨¢s cargas de trabajo como la AI se vuelven comunes en la empresa, el mismo rendimiento y escalabilidad que exige el almacenamiento HPC podr¨ªa terminar siendo m¨¢s beneficioso universalmente.

El almacenamiento de HPC est¨¢ dise?ado para satisfacer las demandas ¨²nicas de las tareas computacionales a gran escala, las simulaciones y las aplicaciones de uso intensivo de datos, pero no todas las cargas de trabajo requerir¨¢n esa velocidad y escalabilidad, y es posible que tengan otros requisitos ¨²nicos. Es importante sopesar las ventajas y desventajas, pero en general, el almacenamiento HPC es bueno para:

  • Conjuntos de datos masivos y cargas de trabajo complejas
  • Rendimiento para admitir el procesamiento paralelo y el acceso r¨¢pido a los datos
  • Crecimiento de datos esperado
  • Integraciones estrechas con cl¨²steres de procesamiento

?Por qu¨¦ FlashBlade para el almacenamiento de HPC?

FlashBlade es utilizado por m¨¢s del 25 % de las empresas de Fortune 100 por su sencillez, agilidad y capacidad para:

  • Maximice la utilizaci¨®n de GPU y CPU.
  • Impulse IOPS masivas, rendimiento con alta simultaneidad y baja latencia sin comprometer el rendimiento multidimensional.
  • Admite decenas de miles de millones de archivos y objetos con el m¨¢ximo rendimiento y servicios de datos enriquecidos.
  • Aproveche las API automatizadas y la asistencia de protocolos nativos de alto rendimiento NFS , SMB y S3 para que las implementaciones, la administraci¨®n y las actualizaciones sean f¨¢ciles.

Buscar recursos y eventos clave

VIDEO
Vea: El valor de una Enterprise Data Cloud.

Charlie Giancarlo explica por qu¨¦ la administraci¨®n de datos, no el almacenamiento, es el futuro. Descubra c¨®mo un enfoque unificado transforma las operaciones de TI de una empresa.

Mirar ahora
RECURSO
El almacenamiento heredado no puede impulsar el futuro.

Las cargas de trabajo modernas exigen velocidad, seguridad y escalabilidad listas para la AI. ?Su pila est¨¢ lista?

Realizar la evaluaci¨®n
DEMOSTRACIONES DE PURE360
Explore, aprenda y experimente É«¿Ø´«Ã½.

Acceda a videos y demostraciones seg¨²n demanda para ver lo que É«¿Ø´«Ã½ puede hacer.

Mire las demostraciones
LIDERAZGO DE PENSAMIENTO
La carrera de la innovaci¨®n.

Los ¨²ltimos conocimientos y perspectivas de l¨ªderes de la industria que est¨¢n a la vanguardia de la innovaci¨®n en almacenamiento.

M¨¢s informaci¨®n
?Su navegador ya no es compatible!

Los navegadores m¨¢s antiguos a menudo representan riesgos de seguridad. Para brindar la mejor experiencia posible al utilizar nuestro sitio, actualice a cualquiera de estos navegadores m¨¢s recientes.

Personalize for Me
Steps Complete!
1
2
3
Thinking...