Index é um termo em inglês que, assim como a sua tradução “índice”, significa um catálogo de informações, como uma biblioteca que possui a listagem de todos os livros disponíveis em suas prateleiras. Nos mecanismos de busca, o index funciona da mesma maneira: ele lista todas as páginas de todos os domínios dos quais tem conhecimento.
Os crawlers do Google, também conhecidos como robots, passam por todos os sites da internet e, quando identificam um novo URL, colocam mais um item em seu extenso arquivo virtual. O mesmo acontece com conteúdos atualizados: os bots vão atualizar as informações e os dados que eles coletaram anteriormente daquela mesma página.
Esse processo é executado automaticamente e com frequência, sendo avaliados alguns critérios importantes como a estrutura do site, tags, otimização para os buscadores (SEO), links, alt text e quaisquer novas informações referentes ao domínio analisado. Os Googlebots também consideram conteúdo e significado para examinar se o URL está conforme os Fundamentos de Pesquisa do mecanismo.
Quando o usuário realiza uma pesquisa, o robô faz uma varredura em todo o arsenal do Google de páginas da internet para encontrar, organizar e classificar os resultados mais relevantes para a busca. Há também a possibilidade de impedir esse rastreio com a utilização de robots.txt que avisam aos bots que não é preciso indexar páginas específicas, como URLs de login ou de acesso restrito.
Como saber se uma página está indexada no Google?
A indexação de uma URL é realizada automaticamente a partir de um rastreio no domínio feito pelo Googlebot. Quando uma nova página é publicada, eles fazem uma varredura para incluir novas informações em seu acervo.
Mas esse processo também pode ser verificado manualmente com algumas práticas, sendo uma delas o comando “site:seudomínio.com.br”, que identifica o que está sendo indexado no mecanismo de pesquisa.
Outra forma é utilizar a ferramenta gratuita do Google, o Search Console. Na plataforma, é possível acompanhar o status de indexação e solicitar o rastreio a uma URL específica, acelerando a visita dos bots àquela seção.
Como garantir o index de uma página no Google
Uma página será anexada corretamente quando os bots a rastrearem, entenderem nela e a listarem em seu índice de conteúdo da web. Com isso feito, os URLs estarão disponíveis no buscador e aparecerão nos resultados de pesquisa para os usuários. A indexação pode ser feita com os seguintes recursos:
Sitemap
O sitemap é o mapa do seu site. Ele será utilizado pelo Googlebot como um caminho a ser percorrido para o rastreio das páginas do seu domínio e indica o que deve ser indexado.
Google Search Console
A ferramenta permite verificar se uma URL está ou não indexada, além de possibilitar a solicitação de index e colocar uma página como prioridade na fila de rastreio do site. Além disso, ele oferece outras funcionalidades que permitem identificar problemas técnicos de rastreabilidade e de indexação que podem ser solucionados.
Produza conteúdos relevantes e otimizados
O conteúdo otimizado para os mecanismos de busca também é um fator de referência para a atuação dos bots. Ao expandir o uso de palavras-chave e links, o índice de informações do buscador se expande e contempla cada vez mais URLs do seu site.
Estratégias relacionadas
- Como analisar indicadores para cada etapa de um projeto SEO?
- Latent Semantic Indexing (LSI) Keyword: Google e o Campo Semântico;
- Como funciona o rastreio do Google?
- Breadcrumbs: aprenda mais sobre esse recurso.
Verbetes relacionados
- Algoritmo de Google;
- Meta Keywords;
- Domínio do site.
Referências
Ajuda do Search Console. Indexando. Disponível em: https://support.google.com/webmasters/answer/7645831?hl=pt-BR.
Central da Pesquisa Google. Perguntas frequentes sobre rastreamento e indexação da Pesquisa Google. Disponível em: https://developers.google.com/search/help/crawling-index-faq?hl=pt-br.
Central da Pesquisa Google. Visão geral dos tópicos sobre rastreamento e indexação. Disponível em: https://developers.google.com/search/docs/crawling-indexing?hl=pt-br.