Google e Nvidia apresentam supercomputador em nuvem A5X

Renê Fraga
7 min de leitura

Principais destaques

  • Nova infraestrutura A5X promete até 10 vezes mais eficiência e redução de custos em operações de IA
  • Parceria entre Google Cloud e Nvidia mira a chamada era da IA agêntica
  • Ferramentas empresariais, simulações digitais e segurança avançada ampliam aplicações práticas da tecnologia

A abertura do Google Cloud Next 2026, realizada em Las Vegas, foi marcada por um anúncio que pode redefinir o rumo da inteligência artificial nos próximos anos.

O Google Cloud e a Nvidia apresentaram oficialmente o A5X, uma nova geração de supercomputação em nuvem pensada para lidar com as crescentes demandas de modelos avançados de IA.

Mais do que um avanço incremental, o A5X representa uma mudança estrutural na forma como empresas desenvolvem, treinam e operam sistemas inteligentes. A proposta é clara: entregar mais poder computacional, maior eficiência energética e custos reduzidos, tudo isso em uma infraestrutura capaz de escalar globalmente.

Nova arquitetura promete salto de desempenho e escala sem precedentes

No centro dessa inovação está a plataforma Vera Rubin NVL72, uma arquitetura de computação de alto desempenho baseada em racks com 72 GPUs de última geração. Essa configuração foi co-desenvolvida pelas duas empresas para maximizar o desempenho em cargas de trabalho intensivas de IA.

A combinação de GPUs avançadas com tecnologias como os SuperNICs ConnectX-9 e a nova malha de rede Virgo cria um ambiente altamente otimizado para processamento paralelo. Segundo o Google, o resultado é impressionante: até 10 vezes mais throughput de tokens por megawatt, além de uma redução significativa no custo por inferência.

Isso significa que tarefas que antes exigiam enormes recursos financeiros e energéticos agora podem ser executadas de forma mais eficiente. Na prática, empresas poderão rodar modelos mais complexos, responder mais rapidamente a usuários e expandir suas operações sem aumentar proporcionalmente os custos.

A rede Virgo, por sua vez, leva a escalabilidade a um novo nível. Ela permite conectar até 80 mil GPUs dentro de um único data center e alcançar até 960 mil GPUs distribuídas globalmente. Esse tipo de infraestrutura é essencial para suportar aplicações modernas de IA, que exigem processamento contínuo e distribuído.

Ferramentas empresariais ampliam o uso da IA no mundo real

A parceria entre as duas gigantes não se limita ao hardware. Um dos pontos mais estratégicos do anúncio é a integração de um ecossistema completo de software voltado para empresas.

Entre os destaques estão os modelos Nemotron, voltados para raciocínio avançado, e os microsserviços NIM, que oferecem inferência otimizada com segurança de nível corporativo. Essas soluções permitem que empresas desenvolvam agentes de IA capazes de tomar decisões, automatizar processos e interagir de forma mais inteligente com usuários.

Outro avanço importante está na integração com plataformas como o Omniverse e o Isaac Sim. Essas ferramentas permitem a criação de gêmeos digitais, representações virtuais de ambientes físicos que podem ser usados para simulação, testes e otimização.

Na indústria, isso pode significar fábricas mais eficientes, cadeias logísticas mais inteligentes e veículos autônomos mais seguros. Empresas podem testar cenários complexos em ambientes virtuais antes de aplicá-los no mundo real, reduzindo riscos e custos.

Além disso, o Google Cloud Marketplace passa a oferecer essas soluções como máquinas virtuais prontas para uso, facilitando a adoção por empresas de diferentes portes e setores.

Segurança e soberania de dados ganham protagonismo

Com o crescimento da inteligência artificial, a segurança dos dados se tornou uma preocupação central. Pensando nisso, o Google Cloud e a Nvidia também anunciaram avanços significativos em computação confidencial.

Utilizando GPUs da linha Blackwell, as empresas permitem que organizações executem modelos de IA mantendo dados sensíveis protegidos, mesmo durante o processamento. Isso inclui prompts de usuários e informações utilizadas no ajuste fino de modelos.

Essa abordagem é especialmente relevante para setores altamente regulados, como finanças, saúde e governo, onde a privacidade e a conformidade são essenciais. Além disso, a possibilidade de operar em ambientes locais com o Google Distributed Cloud atende demandas de soberania de dados, cada vez mais comuns em diferentes países.

Mercado de IA entra em nova fase com foco em agentes

O lançamento do A5X também reflete uma mudança mais ampla no mercado de tecnologia. Se antes o foco estava no treinamento de grandes modelos, agora a atenção se volta para a inferência contínua e a atuação de agentes inteligentes.

Esses agentes são sistemas capazes de executar tarefas de forma autônoma, tomando decisões com base em contexto e objetivos definidos. Esse conceito, conhecido como IA agêntica, é apontado como a próxima grande evolução da inteligência artificial.

Empresas já começam a se movimentar nessa direção. Um exemplo é a Thinking Machines Lab, startup fundada por Mira Murati, que firmou um acordo multibilionário com o Google Cloud. A empresa já utiliza a nova infraestrutura e relata ganhos de até duas vezes em velocidade de treinamento e inferência.

Além disso, o Google anunciou um investimento de 750 milhões de dólares para apoiar parceiros na criação e comercialização de soluções baseadas em IA. Esse movimento reforça a estratégia de expandir o ecossistema e acelerar a adoção da tecnologia em larga escala.

No cenário competitivo, a disputa entre provedores de nuvem se intensifica. Com o avanço do A5X, o Google Cloud se posiciona de forma ainda mais agressiva frente a rivais, apostando em integração profunda entre hardware, software e serviços.

O que fica claro é que a inteligência artificial está entrando em uma nova fase. Não se trata apenas de criar modelos mais poderosos, mas de torná-los acessíveis, eficientes e úteis no dia a dia das empresas. E, nesse contexto, infraestrutura será tão importante quanto os próprios algoritmos.

✨ Curtiu este conteúdo?

O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌

Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!

Clique aqui e faça parte da nossa rede de apoiadores.

Seguir:
Renê Fraga é fundador do Google Discovery (GD) e editor-chefe do Eurisko. Profissional de marketing digital, com pós-graduação pela ESPM, acompanha o Google desde os anos 2000 e escreve há mais de duas décadas sobre tecnologia, produtos digitais e o ecossistema da empresa. Criador do Google Discovery em 2006, tornou-se referência na cobertura do Google no Brasil e foi colunista do TechTudo (Globo.com), compartilhando análises e conhecimento com um grande público.
Nenhum comentário