Google Cloud lança A3, supercomputador privado para treinamento e inferência de modelos de IA

O Google Cloud anunciou o lançamento do A3, um supercomputador privado que permite treinamento e inferência de modelos de aprendizado de máquina (ML) com desempenho de alto nível.

O supercomputador A3 combina GPUs NVIDIA H100 Tensor Core e avanços do Google para atender empresas de todos os portes.

Combinado com a rede inteligente Jupiter da Google, o A3 é capaz de fornecer até 26 exaFlops de desempenho de IA, reduzindo significativamente o tempo e os custos necessários para treinar modelos de ML complexos.

O A3 é o primeiro exemplo de instâncias de GPU que utilizam os IPUs personalizados da Google, permitindo transferências de dados de GPU para GPU que contornam o host da CPU, resultando em uma largura de banda de rede que é até 10 vezes maior do que as instâncias A2 da Google, com baixas latências e alta estabilidade de largura de banda.

O A3 também é o primeiro supercomputador a usar a arquitetura NVIDIA Hopper e a tecnologia NVLink 4.0, que fornece 3x mais poder de processamento do que as instâncias A2 com GPUs NVIDIA A100 Tensor Core.

Além disso, o A3 vem equipado com processadores Intel Xeon Scalable de quarta geração, 2 TB de memória do host via DIMMs DDR5 de 4800 MHz e 10 vezes mais banda larga de rede habilitada por IPUs personalizados, uma pilha de comunicação de GPU inter-servidor especializada e otimizações NCCL.

O A3 é ideal para empresas que desejam treinar modelos de ML complexos e acelerar a inferência de modelos para gerar inteligência de negócios valiosa.

O Google Cloud projetou o A3 para ser altamente escalável e otimizado para desempenho e custo, com o objetivo de fornecer a mais alta performance de treinamento para os modelos de ML mais avançados.

Imagen on Vertex AI: Create and edit images from text

Além disso, os clientes que desejam desenvolver modelos de ML complexos sem a manutenção necessária podem implantar instâncias A3 no Vertex AI, a plataforma de IA integrada da Google para construir modelos de ML em infraestrutura totalmente gerenciada.

Com o lançamento do A3, a Google Cloud oferece agora uma gama completa de opções de GPU para treinamento e inferência de modelos de ML, desde grandes modelos de linguagem até inteligência artificial generativa e modelos de difusão.

A parceria da Google Cloud com a NVIDIA continua a evoluir para fornecer soluções de infraestrutura de IA de última geração para empresas em todo o mundo.

✨ Curtiu este conteúdo?

O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌

Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!

Clique aqui e faça parte da nossa rede de apoiadores.