Por que é o Google remove sites do seu índice



Venho-vos falar de um problema que tem assolado mais e mais webmasters e bloggers em todo o Mundo: a remoção de sites do Google. Já são várias as histórias de montanhas de pessoas que gritam desesperadamente: “o meu site saiu do Google”, “não encontro o meu site no Google”, “que fiz eu para o meu site desaparecer do Google?”. A resposta, meus amigos, encontra-se aqui. Assim espero, assim se deseja.
Confesso que a primeira vez que ouvi falar da remoção de sites da lista de resultados das pesquisas do Google (conhecida como Google Index) foi a partir de um tópico no nosso fórum Meu Site Caiu no Google.

Na altura, não tinha conhecimento de nenhuma mudança estrutural no Google que implicasse uma repentina reordenação de resultados, nem tão pouco de penalização de sites e também já nem me lembrava das Webmaster Guidelinesdo conhecido motor de pesquisa (traduzido para português como Guias de Qualidade para Webmasters).

Considerei que o site no tópicotivesse perdido posições para outros sites devido a nova reordenação do Page Rank do Google. Por outras palavras, tinha sido ultrapassado por sites com maior importância. Todavia, isso dificilmente aconteceria da noite para o dia.

Antes de conseguir encontrar uma resposta conclusiva, o autor do tópicodisse-nos que eram muitas as queixas de outros webmasters na mesma situação nos fóruns do Google.
Julgando ser um problema próprio do Google, pensei que a solução viria do próprio motor de pesquisa.

O Google penaliza sites que infrinjam as Guias de Qualidade

Foi preciso viver na pele a remoção de um dos meus sites para ter de encontrar, com urgência, uma resposta capaz de me satisfazer a curiosidade e de me ajudar a resolver o problema.

Encontrei a resposta que procurava nesta página: Why does Google remove sites from the Google index? (Por que é o Google remove sites do seu índice). Aí são explicadas as razões do Google remover sites do seu índice e aquilo que podemos fazer para voltarmos a ter o nosso site no famoso motor de pesquisa.

A resposta à questão “Por que é o Google remove sites do seu índice” é simples e objectiva: o Google penalizou esses sites porque infrigiram as suas Webmaster Guidelines.

Essas infracções podem passar pelo seguinte:

  • Texto ou links escondidos.
  • Técnicas de cloaking (conteúdo real da página camuflado) ou redireccionamentos não-autorizados.
  • Pesquisas automáticas no Google.
  • Uso de páginas com palavras-chave (keywords) irrelevantes.
  • Conteúdo repetido em múltiplas páginas, subdomínios, ou domínios.
  • Criação de páginas que instalem vírus, cavalos de tróia ou outro software nocivo.
  • Uso de páginas de “entrada” criadas apenas para os mecanismos de pesquisa ou outras técnicas “pré-fabricadas”, como programas de filiação, que têm pouco ou nenhum conteúdo original.
  • Caso o nosso site participe num programa de filiação, ter a certeza que ele adiciona valor. Repetir o mesmo conteúdo do site “mãe” do programa de filiação é que não.

No meu caso o problema estava nos links

Chamo especial atenção para um dos pontos: o dos links. Mesmo que não estejam escondidos.

Até meados de Abril de 2008, o meu site registava, em média 10 a 12 mil visitas por dia. Fui penalizado nessa altura. A partir de então, o site queda-se numa média de 1000 a 2000 visitas diárias. E essas 1000 a 2000 visitas nem sequer provêm do Google.

Não entendia o que de mal teria feito para ter sido penalizado. Li e reli as Guias de Qualidade e não encontrava nada de mal.

Até que cheguei a esta conclusão: o meu site tinha montes de links e eu nem dava por eles.
O conteúdo do site é essencialmente composto por fotos. Essas fotos estão alojadas em alojamentos gratuitos do tipo ImageHack, ImageVenue, etc.
Por forma a disponibilizar essas fotos aos meus visitantes, sou obrigado a colocar miniaturas das fotos (os denominados thumbnails) que têm links para uma página exterior ao site (pertencente aos mencionados alojamentos gratuitos de foto). Na prática, cada foto equivale a um link exterior ao meu site.

Recordando o funcionamento do Page Rank, sabemos que este funciona assim:

O Google interpetra um link da Página A para a Página B como um “voto” da Página A à Página B. O Google acede à importância de uma página web pelo número de “votos” que esta recebe
.

Desta forma o Google “pensou” que cada link do meu site para mostrar uma fotografia, era um link para outro site. Como havia demasiados links para o mesmo site (neste caso para ImageVenue.com), consideram que eu andava a tentar influenciar ilicitamente o Page Rank do ImageVenue. Logo, fui penalizado.

Como evitar que os links influenciem o Page Rank

Um dos grandes problemas dos bloggers que já foram penalizados é o SPAM nos comentários aos seus posts. Muitos spammers aproveitam-se da possibilidade de deixar comentários nos blogs para poderem deixar a sua “sementinha venenosa”. Quer dizer, para deixar um link para o seu site, forçando assim o blog a votar positivamente nesse site (rever definição de Page Rank).

Os principais softwares de blog como o WordPress e outros já resolveram esse problema. Alteraram o software para impedir que os comentários possibilitassem “votos” nos sites dos spammers.

A minha solução

Para resolver o meu caso – centenas de links para fotos – e uma vez que tenho de ter lá esses links (senão não há fotos para ninguém) tive de colocar em cada link o atributo rel=”nofollow” que impede o Googlebot (spider ou crawler do Google que indexa os sites na Internet) de seguir o link, deixando assim de influenciar o Page Rank.

O atributo rel=”nofollow” dos links

De facto, o atributo rel=”nofollow” do elemento < a > serve para impedir que o Google conte como voto para o PageRank o link com esse atributo. Ao usá-lo o nosso site simplesmente deixa de votar no site apontado no link, não sendo considerado um voto nem positivo nem negativo. É mais tipo… uma abstenção, que para nós acaba por ser uma salvaguarda de sermos considerados infractores.

Na realidade, foi o próprio Google que em Janeiro de 2005 introduziu esta prática para evitar o SPAM nos comentários aos artigos em blogs: Prevenção de SPAM nos comentários.

Mais informações sobre este atributo do link podem ser encontradas nesta página: The Components of a Link [HTML Element: A].

Requerer reconsideração ao Google

Após ter colocado o atributo rel=”nofollow” em todos os links, o meu site apresentava-se “limpo” aos olhos do Google e seguia as suas regras de qualidade.

Era altura do passo seguinte: requerer reconsideração. Para o fazer tive de abrir uma conta nas Ferramentas para Webmasters do Google, adicionar o meu site, assegurar ao Google que era eu o dono dele (verify ownership). E pedir que reconsiderassem a re-indexação do meu site no Google (no link Request reconsideration), onde devemos dizer as acções que tomámos para corrigir a infracção.

As infracções pagam-se caro

Agora resta-me esperar… e muito…
Fiz o pedido de reconsideração no dia 22 de Abril de 2008, até hoje ainda… nada. Segundo o Google, terei de esperar várias semanas.

O meu comentário

Foi, de facto, uma penalização violentíssima. Especialmente porque apanhei por tabela, não foi analizado o meu caso pessoalmente (é compreensível, mas injusto). Fui penalizado por usar o elemento fulcral da Internet: o link.

Se o Google usa a tecnologia Page Rank em seu benefício, e se se abusar dos links pode causar represálias, aconselho ao próprio Google que repense seriamente a sua tecnologia (mas quem sou eu para aconselhar o que quer que seja ao Google? :D ).

É certo que os sites penalizados são aqueles que abusam enormemente dos links para um único site (no meu caso ImageVenue) – mas aqui eu nem tenho certeza disto, pode até nem ser por causa de um único site, mas quantos milhares de bloggers e webmasters terão sido penalizados sem o saberem por terem feito coisas tão inocentes como colocarem um links para sites que considerassem importantes? Só por terem muitos artigos ou páginas com muitos links? Então e o que dizer dos fóruns, onde cada tópico costuma ter uma enormidade de links válidos e carregados de interesse para o debate? Vão também ser prejudicados?

Eu ficarei seriamente “escaldado”. Não quero arriscar de novo, por isso, a partir de agora, os meus sites vão deixar de “votar” e todos os meus links vão usar o atributo rel=”nofollow”.

Um cenário dantesco para o Google, seria se todos seguissem o meu exemplo, o Page Rank do Google quase deixaria de ter razão de existir.