O Google Cloud anunciou o lançamento do A3, um supercomputador privado que permite treinamento e inferência de modelos de aprendizado de máquina (ML) com desempenho de alto nível.
O supercomputador A3 combina GPUs NVIDIA H100 Tensor Core e avanços do Google para atender empresas de todos os portes.
Combinado com a rede inteligente Jupiter da Google, o A3 é capaz de fornecer até 26 exaFlops de desempenho de IA, reduzindo significativamente o tempo e os custos necessários para treinar modelos de ML complexos.
O A3 é o primeiro exemplo de instâncias de GPU que utilizam os IPUs personalizados da Google, permitindo transferências de dados de GPU para GPU que contornam o host da CPU, resultando em uma largura de banda de rede que é até 10 vezes maior do que as instâncias A2 da Google, com baixas latências e alta estabilidade de largura de banda.
O A3 também é o primeiro supercomputador a usar a arquitetura NVIDIA Hopper e a tecnologia NVLink 4.0, que fornece 3x mais poder de processamento do que as instâncias A2 com GPUs NVIDIA A100 Tensor Core.
Além disso, o A3 vem equipado com processadores Intel Xeon Scalable de quarta geração, 2 TB de memória do host via DIMMs DDR5 de 4800 MHz e 10 vezes mais banda larga de rede habilitada por IPUs personalizados, uma pilha de comunicação de GPU inter-servidor especializada e otimizações NCCL.
O A3 é ideal para empresas que desejam treinar modelos de ML complexos e acelerar a inferência de modelos para gerar inteligência de negócios valiosa.
O Google Cloud projetou o A3 para ser altamente escalável e otimizado para desempenho e custo, com o objetivo de fornecer a mais alta performance de treinamento para os modelos de ML mais avançados.
Além disso, os clientes que desejam desenvolver modelos de ML complexos sem a manutenção necessária podem implantar instâncias A3 no Vertex AI, a plataforma de IA integrada da Google para construir modelos de ML em infraestrutura totalmente gerenciada.
Com o lançamento do A3, a Google Cloud oferece agora uma gama completa de opções de GPU para treinamento e inferência de modelos de ML, desde grandes modelos de linguagem até inteligência artificial generativa e modelos de difusão.
A parceria da Google Cloud com a NVIDIA continua a evoluir para fornecer soluções de infraestrutura de IA de última geração para empresas em todo o mundo.
✨ Curtiu este conteúdo?
O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌
Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!