A Microsoft lançou suas mais recentes máquinas virtuais Azure otimizadas para supercomputação de IA, a série ND H200 v5.

À medida que o cenário da IA evolui rapidamente, a necessidade de infraestrutura escalável e de alto desempenho continua a crescer exponencialmente. Os clientes da Microsoft contam com a infraestrutura do Azure AI para desenvolver soluções inovadoras orientadas por IA, e é por isso que a empresa está fornecendo novos clusters de supercomputação de IA baseados em nuvem construídos com máquinas virtuais (VMs) da série Azure ND H200 v5. Essas VMs já estão disponíveis de forma geral e são personalizadas para lidar com a crescente complexidade de cargas de trabalho avançadas de IA, desde o treinamento de modelos fundamentais até a inferência generativa.

Um dos aspectos mais interessantes da ND H200 v5 é sua capacidade de lidar com o gargalo causado pelo crescimento da capacidade computacional bruta das GPUs a uma taxa muito mais rápida do que a memória conectada e a largura de banda da memória. As VMs da série ND H200 v5 oferecem um aumento significativo na capacidade e largura de banda da memória de alta largura de banda (HBM), permitindo que as GPUs acessem os parâmetros do modelo mais rapidamente. Isso resulta em uma latência geral reduzida do aplicativo, o que é fundamental para aplicativos em tempo real, como agentes interativos.

Além disso, as VMs ND H200 v5 podem acomodar modelos de linguagem grandes (LLMs) mais complexos na memória de uma única VM. Isso elimina a necessidade de executar trabalhos distribuídos em várias VMs, melhorando o desempenho e reduzindo a complexidade.

Por fim, a ND H200 v5 vem pré-integrada com serviços do Azure como Azure Batch, Azure Kubernetes Service, Azure OpenAI Service e Azure Machine Learning. Essas integrações facilitam o início das empresas com as novas VMs, tornando-as uma opção atraente para organizações que buscam aproveitar o poder da supercomputação de IA.