Google DeepMind apresenta sistema para treinar IA em data centers distantes

Tópicos

Como o sistema muda a lógica do treinamento de IA Uma internet comum pode ser suficiente Aproveitamento inteligente de hardware e recursos Impacto direto no futuro da infraestrutura global

Principais destaques

Nova arquitetura permite treinar modelos de IA em data centers distantes sem depender de conexões ultrarrápidas

Sistema mantém alta eficiência mesmo com falhas, tornando o processo mais resiliente

Redução drástica na largura de banda pode democratizar o acesso ao treinamento de grandes modelos

O Google DeepMind anunciou uma inovação que pode redefinir a forma como a inteligência artificial é treinada em larga escala. O sistema, chamado Decoupled DiLoCo, foi apresentado durante o ICLR 2026, no Rio de Janeiro, e surge como resposta a um dos maiores desafios da indústria: a limitação física e técnica dos data centers tradicionais.

Hoje, treinar modelos avançados exige uma infraestrutura altamente concentrada, com chips sincronizados em altíssima velocidade e conectados por redes extremamente rápidas. Esse modelo não apenas encarece o processo, mas também cria gargalos que dificultam a expansão da capacidade global de IA. A proposta do Google é justamente quebrar essa dependência.

Como o sistema muda a lógica do treinamento de IA

O Decoupled DiLoCo nasce da combinação de duas tecnologias anteriores da empresa: Pathways e DiLoCo. Juntas, elas permitem que diferentes partes do treinamento aconteçam de forma distribuída e menos dependente de comunicação constante entre máquinas.

Na prática, o sistema divide o treinamento em grupos chamados unidades de aprendizado. Cada unidade funciona quase como um mini laboratório independente, realizando diversos cálculos localmente antes de compartilhar apenas informações essenciais com um otimizador central.

Essa troca de dados ocorre de forma assíncrona, o que significa que não é necessário esperar todos os sistemas estarem sincronizados ao mesmo tempo. Isso elimina um dos principais pontos de fragilidade dos métodos tradicionais.

Além disso, essa abordagem reduz drasticamente o impacto de falhas. Se um cluster inteiro parar de funcionar, o restante do sistema continua operando normalmente. Quando o cluster retorna, ele é reintegrado ao processo sem comprometer o progresso já realizado.

Testes com simulação de falhas mostraram um resultado impressionante: o sistema manteve cerca de 88% de eficiência operacional, enquanto abordagens tradicionais despencaram para apenas 27% nas mesmas condições. Isso evidencia um salto significativo em robustez.

Uma internet comum pode ser suficiente

Um dos aspectos mais transformadores dessa tecnologia está na redução da necessidade de largura de banda. Modelos tradicionais exigem conexões de altíssima velocidade, chegando a centenas de gigabits por segundo entre data centers.

Com o Decoupled DiLoCo, esse número caiu drasticamente. Em alguns testes, a exigência foi reduzida para menos de 1 Gbps, algo muito mais próximo da infraestrutura de internet convencional.

Isso significa que o treinamento de modelos avançados deixa de ser exclusivo de ambientes altamente especializados. Empresas e instituições podem, em teoria, utilizar redes já existentes para participar desse processo.

Em um experimento prático, o Google conseguiu treinar um modelo com bilhões de parâmetros distribuído em várias regiões, utilizando conexões entre 2 e 5 Gbps. O desempenho foi mais de 20 vezes superior ao de métodos tradicionais em cenários semelhantes.

Essa mudança não apenas reduz custos, mas também amplia o acesso à tecnologia, permitindo que mais organizações entrem no campo da inteligência artificial avançada.

Aproveitamento inteligente de hardware e recursos

Outro ponto de destaque é a flexibilidade em relação ao hardware utilizado. O novo sistema permite combinar diferentes gerações de chips dentro do mesmo processo de treinamento.

Na prática, isso significa que equipamentos mais antigos não precisam ser descartados. Eles podem continuar sendo utilizados ao lado de tecnologias mais recentes sem perda significativa de desempenho.

Testes que combinaram diferentes versões de aceleradores mostraram resultados equivalentes aos obtidos com hardware homogêneo. Isso representa uma economia relevante e contribui para a sustentabilidade tecnológica.

Além disso, o sistema abre caminho para o uso de capacidade computacional ociosa. Em vez de depender exclusivamente de grandes data centers centralizados, será possível aproveitar recursos espalhados pelo mundo.

Esse modelo distribuído transforma a infraestrutura global em uma espécie de rede colaborativa de processamento, onde diferentes regiões podem contribuir simultaneamente para o treinamento de IA.

Impacto direto no futuro da infraestrutura global

O Decoupled DiLoCo pode marcar uma mudança estrutural na forma como a inteligência artificial é desenvolvida. Ao reduzir a dependência de mega data centers e conexões ultrarrápidas, ele descentraliza o poder computacional.

Isso pode acelerar o desenvolvimento de novos modelos, reduzir custos operacionais e tornar o ecossistema mais resiliente a falhas e limitações físicas.

Outro impacto importante está na escalabilidade. À medida que a demanda por IA cresce mais rápido do que a produção de novos chips, soluções como essa permitem aproveitar melhor os recursos já disponíveis.

Na visão do Google, essa abordagem pode transformar capacidade ociosa em valor real, criando um novo paradigma onde a infraestrutura global funciona de maneira mais eficiente e integrada.

Se essa tecnologia se consolidar, o treinamento de inteligência artificial pode deixar de ser um privilégio de poucas gigantes e passar a ser uma possibilidade mais ampla, abrindo espaço para inovação em diferentes setores e regiões.

✨ Curtiu este conteúdo?

O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌

Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!

Clique aqui e faça parte da nossa rede de apoiadores.