Principais destaques
- Novo algoritmo TurboQuant reduz em até 6 vezes o uso de memória em modelos de IA
- Tecnologia acelera processamento e pode baratear a implantação de inteligência artificial
- Ações de fabricantes de memória caem após anúncio do Google
O Google revelou uma inovação que pode transformar a forma como modelos de inteligência artificial são executados.
Trata-se de um conjunto de algoritmos de compressão que diminui drasticamente a quantidade de memória necessária para operar sistemas avançados, como modelos de linguagem.
O impacto foi imediato no mercado financeiro, com queda nas ações de empresas ligadas à produção de chips de memória e armazenamento.
A tecnologia apresentada inclui três soluções principais: TurboQuant, PolarQuant e Quantized Johnson-Lindenstrauss, conhecido como QJL. Juntas, elas atuam diretamente sobre o chamado cache chave-valor, uma estrutura essencial que armazena informações usadas com frequência durante o funcionamento da IA.
Em testes com modelos como Gemma e Mistral, o TurboQuant conseguiu reduzir o uso de memória para apenas 3 bits, sem necessidade de treinamento adicional, além de acelerar significativamente o processamento.
Como o TurboQuant funciona na prática
O funcionamento do TurboQuant acontece em duas etapas complementares. Primeiro, o PolarQuant transforma os dados em coordenadas polares, substituindo o formato tradicional por uma representação mais eficiente baseada em raio e ângulo. Isso elimina etapas complexas e reduz custos computacionais.
Na sequência, entra o QJL, que aplica uma técnica de correção de erros extremamente leve. Ele projeta possíveis falhas de compressão em um espaço menor, garantindo precisão sem aumentar o uso de memória. O resultado é uma compressão altamente eficiente com desempenho preservado.
Impacto direto no mercado de tecnologia
O anúncio provocou reações imediatas nas bolsas. Empresas como Micron Technology, Western Digital e Seagate Technology registraram quedas, refletindo o receio de que a nova tecnologia reduza a demanda por hardware de memória no futuro.
Instituições financeiras como Morgan Stanley classificaram a inovação como disruptiva, destacando seu potencial de reduzir custos e ampliar o acesso à inteligência artificial, especialmente em serviços de nuvem.
O que muda para o futuro da IA
Apesar da reação inicial do mercado, especialistas apontam que o efeito de longo prazo pode ser mais equilibrado. Isso porque a tecnologia atua apenas na fase de inferência, ou seja, no uso dos modelos já treinados, não impactando diretamente o treinamento, que continua exigindo grande poder computacional.
Além disso, ao tornar a IA mais acessível e barata, o TurboQuant pode incentivar novos usos e aumentar a demanda geral por infraestrutura tecnológica. A expectativa é que a tecnologia seja detalhada em eventos científicos importantes ainda este ano, consolidando seu papel como uma das principais inovações recentes no setor.
✨ Curtiu este conteúdo?
O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌
Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!