Principais destaques:
- Segundo dados da Cloudflare, o Google acessa 3,2 vezes mais páginas da web do que a OpenAI.
- A vantagem estaria ligada ao domínio histórico do Google nas buscas e ao acesso privilegiado concedido por sites.
- Para o CEO da Cloudflare, essa desigualdade pode definir quem vence a corrida da inteligência artificial.
O debate sobre quem tem mais dados na corrida da inteligência artificial ganhou um novo capítulo após declarações de Matthew Prince, CEO da Cloudflare.
Em entrevista ao podcast TBPN, ele afirmou que o Google rastreia mais de três vezes a quantidade de páginas da web acessadas pela OpenAI, criando uma vantagem estrutural difícil de ser alcançada por concorrentes.
Dados da Cloudflare revelam disparidade no rastreamento
De acordo com métricas internas da Cloudflare, para cada página visitada por rastreadores da OpenAI, o Google acessa cerca de 3,2 páginas.
A diferença fica ainda maior quando comparada com outros players: o Google alcançaria quase cinco vezes mais conteúdo online do que a Microsoft, enquanto a Anthropic estaria em nível semelhante ao da Microsoft.
Esses números também aparecem no relatório Year in Review da Cloudflare, que mostrou que o Googlebot alcançou 11,6% das páginas únicas da web em um período recente, contra apenas 3,6% do GPTBot, usado pela OpenAI.
Domínio em buscas garante acesso privilegiado
Segundo Prince, essa vantagem não é recente e tem origem no papel central do Google como motor de busca.
Ao longo dos anos, muitos sites passaram a permitir que o Googlebot acessasse áreas restritas, conteúdos pagos e seções protegidas, algo que outros rastreadores não conseguem fazer.
O problema, na visão do executivo, é que o Googlebot cumpre dois papéis ao mesmo tempo: indexar páginas para resultados de busca e coletar dados para treinar modelos de IA.
Com isso, bloquear o rastreador significaria perder visibilidade no Google, algo que poucos editores estão dispostos a fazer.
Impacto direto na corrida da inteligência artificial
Para o CEO da Cloudflare, a consequência é clara: quem tem mais dados sai na frente. Ele defende que o acesso a grandes volumes de informação é hoje mais decisivo do que ter chips avançados ou grandes equipes de pesquisa.
O tema ganha ainda mais peso em um momento em que o Gemini, do Google, cresce rapidamente em participação de mercado, enquanto o ChatGPT perde espaço relativo.
Dados recentes da Similarweb mostram uma mudança significativa no tráfego de plataformas de IA generativa ao longo do último ano.
Diante desse cenário, Prince sugere que reguladores avaliem limitar o uso da posição dominante do Google em buscas para fins de treinamento de IA ou criem regras que garantam acesso mais equilibrado aos dados.
Para analistas do setor, o debate sobre concentração de dados deve ganhar força nos próximos meses.
✨ Curtiu este conteúdo?
O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌
Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!






