Quais fatores viabilizam a HPC?
H¨¢ quatro fatores principais que favorecem o uso da HPC:
Capacidade de processamento
Em poucas palavras, a largura de banda necess¨¢ria para processar grandes volumes de dados n?o pode ser disponibilizada por um ¨²nico processador. Em vez disso, em um modelo de HPC, v¨¢rios centros de processamento funcionam em paralelo para entregar resultados. Vamos usar o seguinte modelo para retomar:
- O conjunto de computadores individuais ligados em rede ¨¦ chamado de cluster;
- Cada unidade de processamento individual em um cluster ¨¦ chamada de n¨®;
- Cada processador em um n¨® tem v¨¢rios n¨²cleos.?
O exemplo ¨¦ um cluster com 16 n¨®s, cada um com quatro n¨²cleos: trata-se um cluster muito pequeno, representando um total de 64 n¨²cleos operando em paralelo.
A maioria dos casos de uso de HPC envolve milhares de n¨²cleos funcionando em paralelo para realizar processos espec¨ªficos em menos tempo. Os provedores de infraestrutura como servi?o (IaaS, Infrastructure-as-a-Service) permitem que os usu¨¢rios usem grandes quantidades de n¨®s quando necess¨¢rio e reduzam a intensidade da carga de trabalho depois da conclus?o da tarefa. Os usu¨¢rios pagam apenas pela capacidade de processamento necess¨¢ria, sem os custos de despesas de capital (CAPEX, Capital Expenditure) associados ¨¤ instala??o de uma infraestrutura. Com a IaaS, normalmente os usu¨¢rios tamb¨¦m podem atribuir layouts de n¨®s a aplicativos espec¨ªficos, se necess¨¢rio.
Sistema operacional
Sistemas operacionais agem como uma interface entre o hardware e o software usados na HPC. Os dois sistemas operacionais principais usados em ambientes de HPC s?o o Linux e o Windows. O Linux ¨¦ normalmente usado para HPC. J¨¢ o Windows ¨¦ usado apenas quando aplicativos espec¨ªficos do Windows s?o necess¨¢rios.?
Rede
Na HPC, a rede conecta o hardware de computa??o, o armazenamento necess¨¢rio e o usu¨¢rio. O hardware de computa??o ¨¦ conectado por meio de redes que conseguem lidar com uma grande largura de banda de dados. As redes tamb¨¦m devem ter baixa lat¨ºncia para possibilitar transfer¨ºncias de dados r¨¢pidas. As transmiss?es de dados e o gerenciamento de clusters s?o administrados por gerenciadores de clusters, servi?os de gerenciamento ou agendadores.
O gerenciador de cluster executa a carga de trabalho entre os recursos computacionais distribu¨ªdos, como CPUs, FPGAs, GPUs e unidades de disco. Todos os recursos precisam estar conectados ¨¤ mesma rede para que o gerenciador de clusters possa administrar recursos. Ao usar os servi?os de um provedor de IaaS, todos os recursos necess¨¢rios para gerenciar a infraestrutura ser?o aplicados automaticamente pelo provedor.
Armazenamento
Por fim, os dados a serem processados pela HPC precisam ser armazenados em um grande reposit¨®rio. Como os dados podem vir em diferentes formatos (estruturados, semiestruturados e n?o estruturados), podem ser necess¨¢rios diferentes tipos de bancos de dados para armazen¨¢-los.
Os dados em seus formatos brutos s?o armazenados em um data lake. Pode ser dif¨ªcil processar esses dados, pois eles ainda n?o t¨ºm um prop¨®sito associado. Os?data warehouses?armazenam os dados depois do processamento, assim que s?o limpos para atenderem ao seu prop¨®sito espec¨ªfico.?
Armazenamento: o elo perdido da HPC
Em muitos casos de uso de HPC, o armazenamento ¡ª uma pe?a essencial da arquitetura ¡ª costuma ser negligenciado. A HPC ¨¦ usada quando uma grande quantidade de dados precisa ser processada em paralelo, mas seu desempenho depende da capacidade de todos os componentes na arquitetura estarem ¨¤ altura da tarefa.?
Solu??es de armazenamento legadas e tradicionais podem n?o conseguir lidar com as necessidades da HPC, criando gargalos e dificultando o desempenho. O armazenamento de dados precisa acompanhar a velocidade de processamento de todo o conjunto, e ¨¦ por isso que muitas arquiteturas de HPC usam armazenamento?.
O Evergreen//One? oferece armazenamento UFFO r¨¢pido e confi¨¢vel com a conveni¨ºncia do modelo de pagamento conforme o uso. Ele pode ser usado em modelos no local e na nuvem h¨ªbrida e ¨¦ ideal para ambientes de HPC, que exigem a capacidade de dimensionar opera??es sem abrir m?o do desempenho.
Comece a usar o Evergreen//One hoje mesmo. Os tr¨ºs primeiros meses do servi?o s?o gratuitos?para novos clientes.