O Google procura exibir em seus resultados de busca informação relevante a seus usuários. Que benefício tem uma pessoa ao realizar uma busca no Google e os 10 primeiros resultados forem iguais, cópia de alguma página na internet? Nenhum. Por esse motivo, o índice Google procura oferecer uma variedade de conteúdo exclusivo e diversificado em seus resultados.
Conteúdo duplicado entre sites ou mesmo dentro de um mesmo site, então, passa a ser uma preocupação que todo o projeto de SEO deve endereçar. Um bom projeto de SEO, White Hat, deve procurar sempre gerar conteúdo exclusivo, relevante às pessoas pesquisando pelo assunto.
Existem motivos voluntários e involuntários para o surgimento de conteúdo duplicado na internet, como por exemplo:
Alguns membros da comunidade SEO costumam exagerar a importância de conteúdo duplicado. Aqui na SEO Marketing, desenvolvemos nossos projetos de SEO White Hat com redatores web gerando conteúdo de qualidade e exclusivo.
A probabilidade de termos problemas com conteúdo duplicado é nula, e o mesmo se aplica para qualquer projeto de SEO de qualidade desenvolvido por outros webmasters.
Ao mesmo tempo, o algoritmo do Google deve ser o minimamente inteligente para identificar pequenas falhas involuntárias de sites de qualidade. Existem sinais, porém, de que o Google começou a ser menos complacente com esses deslizes. Jill Whallen escreveu um interessante artigo (em inglês) a respeito desse assunto.
Por outro lado, espera-se que o algoritmo do Google consiga interpretar qual o conteúdo original, e exibi-lo dessa forma acima das páginas copiadas. Para isso, um dos fatores utilizados por ele é a data de indexação do conteúdo.
Quanto mais antigo, maior a probabilidade desse conteúdo ser o original, e com isso ser exibido antes de páginas copiadas.
Para saber se o seu conteúdo original é de fato o conteúdo considerado original pelo buscador, faça uma busca no Google por um parágrafo de seu conteúdo, iniciando e terminando a busca com aspas. Se o seu site aparecer em primeiro, o Google cumpriu a sua missão!
Em servidores Apache, o método mais comum de se aplicar o redirecionamento 301 é utilizando o arquivo ".htaccess" . Dentro desse arquivo é inserido um código em expressão regular como por exemplo:
RewriteCond %{HTTP_HOST} ^meusite\.com\.br$ [OR]
RewriteCond %{HTTP_HOST} ^www\.meusite\.com\.br$ [OR]
RewriteCond %{HTTP_HOST} ^meusite\.com\.br\/$
RewriteRule ^index\.html\/?(.*)$ "http\:\/\/www\.meusite\.com\.br\/$1" [R=301,L]
Neste exemplo basta substituir a palavra "meusite" para o nome do seu site.
Este é um método mais simples que o anterior, mas também muito eficiente. A utilização da Canonical Tag permite-nos informar ao Google qual a página que possui o conteúdo original, de onde foi copiado o conteúdo.
Com a sua utilização, podemos copiar trechos ou mesmo páginas inteiras de outras páginas de dentro ou fora de nosso site, sem corrermos o risco de sofrermos alguma penalização por isso. A Canonical Tag é inserida dentro da página que copiou o conteúdo, mais especificamente dentro da tag <head>. Veja o exemplo:
<link rel="canonical" href="www.meusite.com.br"/>
Neste exemplo basta substituir a URL href=”www.meusite.com.br" pela página que possui o conteúdo original, de onde foi copiado o conteúdo.