Principais destaques
- Nova infraestrutura A5X promete até 10 vezes mais eficiência e redução de custos em operações de IA
- Parceria entre Google Cloud e Nvidia mira a chamada era da IA agêntica
- Ferramentas empresariais, simulações digitais e segurança avançada ampliam aplicações práticas da tecnologia
A abertura do Google Cloud Next 2026, realizada em Las Vegas, foi marcada por um anúncio que pode redefinir o rumo da inteligência artificial nos próximos anos.
O Google Cloud e a Nvidia apresentaram oficialmente o A5X, uma nova geração de supercomputação em nuvem pensada para lidar com as crescentes demandas de modelos avançados de IA.
Mais do que um avanço incremental, o A5X representa uma mudança estrutural na forma como empresas desenvolvem, treinam e operam sistemas inteligentes. A proposta é clara: entregar mais poder computacional, maior eficiência energética e custos reduzidos, tudo isso em uma infraestrutura capaz de escalar globalmente.
Nova arquitetura promete salto de desempenho e escala sem precedentes
No centro dessa inovação está a plataforma Vera Rubin NVL72, uma arquitetura de computação de alto desempenho baseada em racks com 72 GPUs de última geração. Essa configuração foi co-desenvolvida pelas duas empresas para maximizar o desempenho em cargas de trabalho intensivas de IA.
A combinação de GPUs avançadas com tecnologias como os SuperNICs ConnectX-9 e a nova malha de rede Virgo cria um ambiente altamente otimizado para processamento paralelo. Segundo o Google, o resultado é impressionante: até 10 vezes mais throughput de tokens por megawatt, além de uma redução significativa no custo por inferência.
Isso significa que tarefas que antes exigiam enormes recursos financeiros e energéticos agora podem ser executadas de forma mais eficiente. Na prática, empresas poderão rodar modelos mais complexos, responder mais rapidamente a usuários e expandir suas operações sem aumentar proporcionalmente os custos.
A rede Virgo, por sua vez, leva a escalabilidade a um novo nível. Ela permite conectar até 80 mil GPUs dentro de um único data center e alcançar até 960 mil GPUs distribuídas globalmente. Esse tipo de infraestrutura é essencial para suportar aplicações modernas de IA, que exigem processamento contínuo e distribuído.
Ferramentas empresariais ampliam o uso da IA no mundo real
A parceria entre as duas gigantes não se limita ao hardware. Um dos pontos mais estratégicos do anúncio é a integração de um ecossistema completo de software voltado para empresas.
Entre os destaques estão os modelos Nemotron, voltados para raciocínio avançado, e os microsserviços NIM, que oferecem inferência otimizada com segurança de nível corporativo. Essas soluções permitem que empresas desenvolvam agentes de IA capazes de tomar decisões, automatizar processos e interagir de forma mais inteligente com usuários.
Outro avanço importante está na integração com plataformas como o Omniverse e o Isaac Sim. Essas ferramentas permitem a criação de gêmeos digitais, representações virtuais de ambientes físicos que podem ser usados para simulação, testes e otimização.
Na indústria, isso pode significar fábricas mais eficientes, cadeias logísticas mais inteligentes e veículos autônomos mais seguros. Empresas podem testar cenários complexos em ambientes virtuais antes de aplicá-los no mundo real, reduzindo riscos e custos.
Além disso, o Google Cloud Marketplace passa a oferecer essas soluções como máquinas virtuais prontas para uso, facilitando a adoção por empresas de diferentes portes e setores.
Segurança e soberania de dados ganham protagonismo
Com o crescimento da inteligência artificial, a segurança dos dados se tornou uma preocupação central. Pensando nisso, o Google Cloud e a Nvidia também anunciaram avanços significativos em computação confidencial.
Utilizando GPUs da linha Blackwell, as empresas permitem que organizações executem modelos de IA mantendo dados sensíveis protegidos, mesmo durante o processamento. Isso inclui prompts de usuários e informações utilizadas no ajuste fino de modelos.
Essa abordagem é especialmente relevante para setores altamente regulados, como finanças, saúde e governo, onde a privacidade e a conformidade são essenciais. Além disso, a possibilidade de operar em ambientes locais com o Google Distributed Cloud atende demandas de soberania de dados, cada vez mais comuns em diferentes países.
Mercado de IA entra em nova fase com foco em agentes
O lançamento do A5X também reflete uma mudança mais ampla no mercado de tecnologia. Se antes o foco estava no treinamento de grandes modelos, agora a atenção se volta para a inferência contínua e a atuação de agentes inteligentes.
Esses agentes são sistemas capazes de executar tarefas de forma autônoma, tomando decisões com base em contexto e objetivos definidos. Esse conceito, conhecido como IA agêntica, é apontado como a próxima grande evolução da inteligência artificial.
Empresas já começam a se movimentar nessa direção. Um exemplo é a Thinking Machines Lab, startup fundada por Mira Murati, que firmou um acordo multibilionário com o Google Cloud. A empresa já utiliza a nova infraestrutura e relata ganhos de até duas vezes em velocidade de treinamento e inferência.
Além disso, o Google anunciou um investimento de 750 milhões de dólares para apoiar parceiros na criação e comercialização de soluções baseadas em IA. Esse movimento reforça a estratégia de expandir o ecossistema e acelerar a adoção da tecnologia em larga escala.
No cenário competitivo, a disputa entre provedores de nuvem se intensifica. Com o avanço do A5X, o Google Cloud se posiciona de forma ainda mais agressiva frente a rivais, apostando em integração profunda entre hardware, software e serviços.
O que fica claro é que a inteligência artificial está entrando em uma nova fase. Não se trata apenas de criar modelos mais poderosos, mas de torná-los acessíveis, eficientes e úteis no dia a dia das empresas. E, nesse contexto, infraestrutura será tão importante quanto os próprios algoritmos.
✨ Curtiu este conteúdo?
O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌
Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!