Discovery SEO: Como o Google indexa a Internet?

Lucas Jim
4 min de leitura

Hoje mostraremos como o Google indexa as páginas da web e ainda falaremos sobre a importância de sitemaps para ajudar o buscador a indexar seu conteúdo com maior facilidade.

Uma estrutura muito grande

Imagine um grande centro de processamento de dados, ligado 24 horas por dia, procurando por novas páginas sem parar. Agora imagine, que esses computadores já localizaram mais de 1 trilhão de páginas. Bilhões dessas páginas fazem parte de um índice, que é consultado cada vez que você faz uma pesquisa. Esse é o Google Search.

Mas… como ele chega a todas essas páginas?

Esse grande conglomerado de computadores rodam um programa conhecido como Googlebot (que também pode ser chamado de spiders).

O segredo para a rastreamento dos bilhões de páginas da web está nos links. Como já sabemos, os links ligam uma página a outra. Ao fazer isso, a página “linkada” se tornou pública, em razão de alguém ter apontado para ela. As spiders do Google aproveitam-se disso para conhecer essas novas páginas. É um processo longo que pode ser simplificado assim:

As spiders percorrem os sites que já são conhecidos por elas na internet, em busca de conteúdo atualizado. Além de se atualizar com as páginas já encontradas anteriormente, as spiders frequentemente acham links desconhecidos por elas, que passarão a ser explorados também. Através desses links, antes desconhecidos, as spiders chegam até as novidades, que começam a fazer parte de seu mapa. Esse processo acontece o tempo inteiro em uma escala gigante!

Como isso é organizado?

O Googlebot processa cada uma das páginas encontradas (!!!) para reunir em um índice gigante as palavras que achou dentro delas, bem como as posições dessas palavras dentro de suas respectivas páginas. Haja processamento, heim?

Daí em diante ele responde às pesquisas organizando este índice, por ordem de relevância.

#HelpTheSpiders

Quando eu aprendi como tudo isso funcionava, logo fiquei com pena das pobres spiders. Já pensaram o que significa vasculhar cada página da internet em busca de links que levam a novas páginas? Claro, elas são automatizadas… mas de qualquer forma podemos poupar boa parte do esforço do Google e ganhar tempo agilizando o trabalho de localização e indexação de nossas páginas usando sitemaps!

What the hell?

Basicamente, como o nome informa, é o mapa do site. Existem dois tipos de sitemaps. Por enquanto, vamos focar nos que ajudam os buscadores.

Esses têm um valor grande para as spiders. Um mapa assim é constituído por um arquivo XML que fica no seu servidor. Esse mapa informa aos robôs das buscas onde exatamente eles podem encontrar cada página do seu site.

O Google gosta disso! Isso agiliza o trabalho de rastreamento e indexação de sites de maneira muito eficiente.

#Comofas

Bom, como fazer e utilizar bem um sitemap, eu explico em outro post. Até mais!

✨ Curtiu este conteúdo?

O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌

Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!

Clique aqui e faça parte da nossa rede de apoiadores.

10 Comentários