Principais destaques:
- Novo sistema promete reconhecer vídeos falsos até quando o rosto não aparece.
- Ferramenta analisa movimento, fundo e luz para detectar manipulações sutis.
- Tecnologia pode se tornar essencial para jornalistas e redes sociais na luta contra a desinformação.
A ameaça invisível dos deepfakes
Vídeos gerados por inteligência artificial estão cada vez mais realistas e perigosos.
O que antes parecia uma brincadeira tecnológica virou uma ferramenta poderosa de manipulação, capaz de criar imagens e vozes falsas de pessoas reais.
Para enfrentar essa nova forma de desinformação, o Google se uniu à Universidade da Califórnia, em Riverside, e lançou o UNITE, sigla para Universal Network for Identifying Tampered and synthEtic videos.
O UNITE se diferencia de outras tecnologias porque identifica falsificações mesmo quando o vídeo não mostra rostos.
A detecção acontece ao examinar planos de fundo, padrões de movimento e pequenos detalhes que escapam à percepção humana.
Como funciona o detector do Google
O sistema foi construído a partir de um modelo baseado em transformers, a mesma arquitetura usada em grandes modelos de linguagem e visão.
Ele analisa cada quadro do vídeo e procura inconsistências de espaço e tempo, minúsculas falhas geradas quando um conteúdo é manipulado.
A base do funcionamento do UNITE está num mecanismo de aprendizado conhecido como SigLIP (Sigmoid Loss for Language Image Pre-Training), que permite ao modelo reconhecer padrões visuais sem depender de um objeto ou pessoa específica.
Outra inovação é o método chamado “attention-diversity loss”, que obriga o sistema a observar várias regiões da imagem, evitando que ele se concentre apenas em rostos.
A parceria com o Google ofereceu aos pesquisadores acesso a enormes bancos de dados e poder computacional suficiente para treinar o modelo com diferentes tipos de falsificação, desde simples trocas de rosto até vídeos totalmente gerados por IA a partir de texto ou imagens estáticas.
Por que o UNITE é importante
A chegada do UNITE ocorre em um momento crítico.
Ferramentas de geração de vídeo a partir de texto se popularizaram e permitem que qualquer pessoa produza vídeos falsos com aparência profissional.
O que representa uma ameaça séria à reputação de indivíduos, empresas e até à democracia, dependendo do contexto político de cada país.
O estudo foi apresentado na Conferência de Visão Computacional e Reconhecimento de Padrões de 2025 (CVPR), realizada em Nashville, nos Estados Unidos.
O artigo descreve a arquitetura e o processo de treinamento do UNITE e sugere que esta pode ser a primeira solução realmente universal para detecção de vídeos sintéticos, um passo importante para preservar a confiança nas imagens que vemos.
✨ Curtiu este conteúdo?
O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌
Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!






