Quais fatores viabilizam a HPC?
Há quatro fatores principais que favorecem o uso da HPC:
Capacidade de processamento
Em poucas palavras, a largura de banda necessária para processar grandes volumes de dados n?o pode ser disponibilizada por um único processador. Em vez disso, em um modelo de HPC, vários centros de processamento funcionam em paralelo para entregar resultados. Vamos usar o seguinte modelo para retomar:
- O conjunto de computadores individuais ligados em rede é chamado de cluster;
- Cada unidade de processamento individual em um cluster é chamada de nó;
- Cada processador em um nó tem vários núcleos.?
O exemplo é um cluster com 16 nós, cada um com quatro núcleos: trata-se um cluster muito pequeno, representando um total de 64 núcleos operando em paralelo.
A maioria dos casos de uso de HPC envolve milhares de núcleos funcionando em paralelo para realizar processos específicos em menos tempo. Os provedores de infraestrutura como servi?o (IaaS, Infrastructure-as-a-Service) permitem que os usuários usem grandes quantidades de nós quando necessário e reduzam a intensidade da carga de trabalho depois da conclus?o da tarefa. Os usuários pagam apenas pela capacidade de processamento necessária, sem os custos de despesas de capital (CAPEX, Capital Expenditure) associados à instala??o de uma infraestrutura. Com a IaaS, normalmente os usuários também podem atribuir layouts de nós a aplicativos específicos, se necessário.
Sistema operacional
Sistemas operacionais agem como uma interface entre o hardware e o software usados na HPC. Os dois sistemas operacionais principais usados em ambientes de HPC s?o o Linux e o Windows. O Linux é normalmente usado para HPC. Já o Windows é usado apenas quando aplicativos específicos do Windows s?o necessários.?
Rede
Na HPC, a rede conecta o hardware de computa??o, o armazenamento necessário e o usuário. O hardware de computa??o é conectado por meio de redes que conseguem lidar com uma grande largura de banda de dados. As redes também devem ter baixa latência para possibilitar transferências de dados rápidas. As transmiss?es de dados e o gerenciamento de clusters s?o administrados por gerenciadores de clusters, servi?os de gerenciamento ou agendadores.
O gerenciador de cluster executa a carga de trabalho entre os recursos computacionais distribuídos, como CPUs, FPGAs, GPUs e unidades de disco. Todos os recursos precisam estar conectados à mesma rede para que o gerenciador de clusters possa administrar recursos. Ao usar os servi?os de um provedor de IaaS, todos os recursos necessários para gerenciar a infraestrutura ser?o aplicados automaticamente pelo provedor.
Armazenamento
Por fim, os dados a serem processados pela HPC precisam ser armazenados em um grande repositório. Como os dados podem vir em diferentes formatos (estruturados, semiestruturados e n?o estruturados), podem ser necessários diferentes tipos de bancos de dados para armazená-los.
Os dados em seus formatos brutos s?o armazenados em um data lake. Pode ser difícil processar esses dados, pois eles ainda n?o têm um propósito associado. Os?data warehouses?armazenam os dados depois do processamento, assim que s?o limpos para atenderem ao seu propósito específico.?
Armazenamento: o elo perdido da HPC
Em muitos casos de uso de HPC, o armazenamento — uma pe?a essencial da arquitetura — costuma ser negligenciado. A HPC é usada quando uma grande quantidade de dados precisa ser processada em paralelo, mas seu desempenho depende da capacidade de todos os componentes na arquitetura estarem à altura da tarefa.?
Solu??es de armazenamento legadas e tradicionais podem n?o conseguir lidar com as necessidades da HPC, criando gargalos e dificultando o desempenho. O armazenamento de dados precisa acompanhar a velocidade de processamento de todo o conjunto, e é por isso que muitas arquiteturas de HPC usam armazenamento?.
O Evergreen//One? oferece armazenamento UFFO rápido e confiável com a conveniência do modelo de pagamento conforme o uso. Ele pode ser usado em modelos no local e na nuvem híbrida e é ideal para ambientes de HPC, que exigem a capacidade de dimensionar opera??es sem abrir m?o do desempenho.
Comece a usar o Evergreen//One hoje mesmo. Os três primeiros meses do servi?o s?o gratuitos?para novos clientes.