Google pode treinar sua IA da busca mesmo quando sites optam por não compartilhar

Renê Fraga
2 min de leitura

Uma revelação feita durante um julgamento nos Estados Unidos chamou a atenção de quem acompanha o mercado de tecnologia e, principalmente, a atuação do Google na área de inteligência artificial.

Um executivo da empresa afirmou que o Google pode usar conteúdo de sites da internet para treinar seus recursos de IA voltados à busca — mesmo quando esses sites optaram por não permitir o uso de seus dados em modelos de IA.

A explicação é técnica, mas importante: segundo Eli Collins, vice-presidente da DeepMind (o laboratório de IA do Google), o sistema de exclusão que os sites usam (chamado robots.txt) impede apenas o treinamento feito diretamente pela DeepMind.

Outras áreas da empresa, como a equipe de busca, ainda podem utilizar os dados dos sites para aprimorar suas próprias ferramentas — como o AI Overviews, que gera respostas com inteligência artificial diretamente no topo dos resultados de busca.

Naturalmente isso gerou questionamentos no tribunal, já que muitos sites estão preocupados com a perda de audiência.

Se o Google exibe as respostas prontas com IA, os usuários podem deixar de visitar os sites originais, afetando a principal fonte de receita de muitas páginas: os anúncios.

Para evitar que seus dados sejam usados pela IA da busca, os editores precisariam bloquear completamente o acesso do Google, o que significaria desaparecer dos resultados de busca — um verdadeiro dilema.

Durante o julgamento, documentos internos mostraram que o Google removeu 80 bilhões de blocos de dados (chamados de “tokens”) de um total de 160 bilhões, por conta das solicitações de exclusão feitas pelos sites.

Mesmo assim, a empresa continua utilizando outras fontes, como dados de sessões de busca dos usuários e até vídeos do YouTube, para treinar e melhorar seus modelos.

O caso está sendo acompanhado de perto pelas autoridades americanas, que querem impor mudanças na forma como o Google opera a busca — incluindo restrições ao uso de seus dados e domínio sobre outros navegadores e aplicativos.

✨ Curtiu este conteúdo?

O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌

Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!

Clique aqui e faça parte da nossa rede de apoiadores.

Seguir:
Renê Fraga é fundador do Google Discovery (GD) e editor-chefe do Eurisko. Profissional de marketing digital, com pós-graduação pela ESPM, acompanha o Google desde os anos 2000 e escreve há mais de duas décadas sobre tecnologia, produtos digitais e o ecossistema da empresa. Criador do Google Discovery em 2006, tornou-se referência na cobertura do Google no Brasil e foi colunista do TechTudo (Globo.com), compartilhando análises e conhecimento com um grande público.
Nenhum comentário