Como e quando criar um sitemap.xml e sitemap em HTML
Sitemap HTML: Os sites de busca fazem um bom trabalho com seus robôs em varrer o conteúdo da internet. Existem porém duas formas de ajudá-lo a acelerar o processo ou fornecer acesso a páginas que o robô tem dificuldade em acessar.
O primeiro método, e mais simples, é criar uma página HTML com links para as páginas que queremos indexar. Com isso, o Googlebot conseguirá facilmente encontrar as páginas, seguindo os links até elas.
Aproveite para trabalhar o texto âncora nos links, ou seja, o "texto clicável" do link. Procure utilizar um texto âncora relacionado ao tema da página de destino.
Geralmente as páginas de sitemaps em HTML são acessadas por um ícone semelhante a um organograma no canto superior direito do site.
Sitemap.xml: Os sites de busca oferecem ainda um mecanismo para que webmasters submetam o conteúdo de seus sites através de um sitemap (mapa de site) no formato XML (eXtensible Markup Language) ou .TXT.
O nome do arquivo não possui um padrão obrigatório, mas geralmente é chamado de SITEMAP.XML. O sitemap.xml é um arquivo que tem a finalidade de listar as páginas de um site que gostaríamos de ter presentes nos resultados de busca. O Google permite ainda a submissão de imagens e vídeos.
Resumindo, arquivo sitemap.xml é usado como um índice aos buscadores, facilitando o acesso a essas páginas e arquivos. Vale frisar, porém, que é muito mais importante ter um site facilmente rastreável pelos robôs do que usar o sitemap.xml para contornar falhas na arquitetura do site.
O Google recomenda criar Sitemaps com no máximo 50.000 URLs. Porém, pela nossa experiência, recomendamos arquivos com no máximo 10.000 URLs. Caso seja necessário, poderá ser criado mais de um arquivo, como por exemplo sitemap1.xml, sitemap2.xml, etc. O arquivo sitemap.xml pode ser criado de três formas:
Uma vez gerado o (ou os) arquivo(s) sitemap, este deve ser colocado preferencialmente no diretório principal do site. Em seguida, deve ser informados ao Google a localização e nome do arquivo. Existem duas formas para isso:
O Google Search Console possui uma área onde webmasters podem submeter seus sitemaps xml e acompanhar o status de indexação das páginas e arquivos submetidos. Essa área é acessada em Índice -> Sitemaps. Veja na figura abaixo um exemplo:
Como vimos no tópico anterior deste tutorial SEO, é possível informar ao Google e demais sites de busca a localização dos arquivos sitemap.xml através do robots.txt.
Um novo protocolo para Sitemaps reconhecido pelo Google disponibiliza recursos adicionais para um maior controle do robô do Google.
As vantagens do novo padrão são resultados de pesquisa mais atualizados e rastreamento mais eficiente, pois são fornecidos aos buscadores informações específicas sobre detalhes das páginas de seu site, como a frequência de atualização desejada e a relevância de determinada página.
Para explorar todas as novas funcionalidades, o arquivo deve ser criado no formato XML, embora exista também o formato TXT. O arquivo TXT será uma simples lista de URLs.
O sitemap baseado em XML, por outro lado, permite que além de submeter as URLs, seja informada a prioridade de cada página, frequência de atualização e última modificação executada.
Para usar os recursos do novo modelo de Sitemap, siga as regras do formato XML e adicione as tags específicas:
<urlset xmlns="https://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.seusite.com.br</loc>
<lastmod>20-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
Mais detalhes sobre o protocolo sitemap podem ser encontrados no site https://www.sitemaps.org/protocol.html