Comment optimiser les sitemaps XML : 13 bonnes pratiques en matière de SEO

Comment optimiser les sitemaps XML : 13 bonnes pratiques en matière de SEO

Un plan du site est un élément important de l’optimisation de tout site Web. Voici 13 conseils pour créer et optimiser votre plan de site pour les moteurs de recherche et les visiteurs.

Créer et mettre à jour votre plan de site XML est une pratique de référencement essentielle mais négligée.

Les sitemaps sont importants pour vos sites et moteurs de recherche.

Pour les moteurs de recherche, les plans de site sont un moyen simple et direct d’obtenir des informations sur la structure et les pages de votre site Web.

Les sitemaps XML fournissent également des métadonnées cruciales, telles que :

  • La fréquence à laquelle chaque page est mise à jour.
  • Quand ils ont été changés pour la dernière fois.
  • Quelle est l’importance des pages les unes par rapport aux autres.

Cependant, il existe certaines meilleures pratiques pour utiliser un plan de site à votre avantage maximum.

Prêt à apprendre à optimiser les sitemaps XML ?

Ce qui suit sont les 13 meilleures pratiques pour obtenir le meilleur SEO pour votre argent.

1. Utilisez des outils et des plugins pour générer automatiquement votre plan de site

La génération d’un plan de site est facile lorsque vous disposez des bons outils, tels qu’un logiciel d’audit avec un générateur de plan de site XML intégré ou des plug-ins populaires tels que Google XML Sitemaps .

En fait, les sites Web WordPress qui utilisent déjà Yoast SEO peuvent activer les sitemaps XML directement dans le plugin .

Alternativement, vous pouvez créer manuellement un plan de site en suivant la structure de code de plan de site XML.

Techniquement, votre sitemap n’a même pas besoin d’être au format XML – un fichier texte avec une nouvelle ligne séparant chaque URL suffira.

Cependant, vous devrez générer un plan de site XML complet si vous souhaitez implémenter l’attribut hreflang , il est donc beaucoup plus facile de laisser un outil faire le travail à votre place.

Visitez les pages officielles Google et Bing pour plus d’informations sur la configuration manuelle de votre plan de site.

2. Soumettez votre plan de site à Google

Vous pouvez soumettre votre sitemap à Google à partir de là search console de Google .

Depuis votre tableau de bord, cliquez sur Explorer > Plans de site > Ajouter un plan de site de test .

Testez votre plan du site et affichez les résultats avant de cliquer sur Soumettre le plan du site pour rechercher les erreurs susceptibles d’empêcher l’indexation des pages de destination clés.

Idéalement, vous voulez que le nombre de pages indexées soit le même que le nombre de pages soumises.

Notez que la soumission de votre sitemap indique à Google quelles pages vous considérez comme de haute qualité et dignes d’ être indexées , mais cela ne garantit pas qu’elles seront indexées.

Au lieu de cela, l’avantage de soumettre votre plan de site est de :

  • Aidez Google à comprendre la présentation de votre site Web.
  • Découvrez les erreurs que vous pouvez corriger pour vous assurer que vos pages sont correctement indexées.

3. Donnez la priorité aux pages de haute qualité dans votre plan de site

En matière de classement, la qualité globale du site est un facteur clé.

Si votre plan de site dirige les robots vers des milliers de pages de mauvaise qualité, les moteurs de recherche interprètent ces pages comme un signe que votre site Web n’est probablement pas celui que les gens voudront visiter, même si les pages sont nécessaires pour votre site, comme les pages de connexion.

Essayez plutôt de diriger les robots vers les pages les plus importantes de votre site.

Idéalement, ces pages sont :

  • Hautement optimisé.
  • Incluez des images et des vidéos.
  • Avoir beaucoup de contenu unique.
  • Encouragez l’engagement des utilisateurs par le biais de commentaires et d’avis.

4. Isoler les problèmes d’indexation

Google Search Console peut être un peu frustrant s’il n’indexe pas toutes vos pages, car il ne vous dit pas quelles pages sont problématiques.

Par exemple, si vous soumettez 20 000 pages et que seulement 15 000 d’entre elles sont indexées, on ne vous dira pas quelles sont les 5 000 « pages à problèmes ».

Cela est particulièrement vrai pour les grands sites Web de commerce électronique qui ont plusieurs pages pour des produits très similaires.

Le consultant SEO Michael Cottam a écrit un guide utile pour isoler les pages problématiques.

Il recommande de diviser les pages de produits en différents plans de site XML et de tester chacun d’eux.

Créez des sitemaps qui confirmeront des hypothèses, telles que « les pages qui n’ont pas d’images de produits ne sont pas indexées » ou « les pages sans copie unique ne sont pas indexées ».

Lorsque vous avez isolé les principaux problèmes, vous pouvez soit travailler pour résoudre les problèmes, soit définir ces pages sur « noindex », afin qu’elles ne diminuent pas la qualité globale de votre site.

En 2018, Google Search Console a été mis à jour en termes de couverture d’index .

En particulier, les pages problématiques sont désormais répertoriées et les raisons pour lesquelles Google n’indexe pas certaines URL sont fournies.

5. Incluez uniquement les versions canoniques des URL dans votre plan de site

Lorsque vous avez plusieurs pages très similaires, telles que des pages de produits pour différentes couleurs du même produit, vous devez utiliser la balise « link rel=canonical » pour indiquer à Google quelle page est la page « principale » qu’il doit explorer et indexer.

Les bots découvrent plus facilement les pages clés si vous n’incluez pas de pages avec des URL canoniques pointant vers d’autres pages.

6. Utilisez Robots Meta Tag sur Robots.txt dans la mesure du possible

Lorsque vous ne souhaitez pas qu’une page soit indexée, vous souhaitez généralement utiliser la balise « noindex,follow » des méta robots .

Cela empêche Google d’indexer la page mais cela préserve l’équité de vos liens, et c’est particulièrement utile pour les pages utilitaires qui sont importantes pour votre site mais ne devraient pas apparaître dans les résultats de recherche.

La seule fois où vous souhaitez utiliser robots.txt pour bloquer des pages, c’est lorsque vous épuisez votre budget de crawl .

Si vous remarquez que Google réexplore et indexe des pages relativement peu importantes (par exemple, des pages de produits individuelles) au détriment des pages principales, vous pouvez utiliser robots.txt.

7. Créez des plans de site XML dynamiques pour les grands sites

Il est presque impossible de suivre tous vos méta-robots sur d’énormes sites Web.

Au lieu de cela, vous devez définir des règles  pour déterminer quand une page sera incluse dans votre plan de site XML et/ou modifiée de noindex à « index, follow ».

Vous pouvez trouver des instructions détaillées sur la façon exacte de créer un plan de site XML dynamique, mais, encore une fois, cette étape est beaucoup plus facile à l’aide d’un outil qui génère des plans de site dynamiques pour vous.

8. Utilisez des plans de site XML et des flux RSS/Atom

Les flux RSS/Atom avertissent les moteurs de recherche lorsque vous mettez à jour une page ou ajoutez du nouveau contenu à votre site Web.

Google recommande d’utiliser à la fois des plans de site et des flux RSS/Atom pour aider les moteurs de recherche à comprendre quelles pages doivent être indexées et mises à jour.

En n’incluant que du contenu récemment mis à jour dans vos flux RSS/Atom, vous faciliterez la recherche de contenu frais pour les moteurs de recherche et les visiteurs.

9. Mettez à jour les heures de modification uniquement lorsque vous apportez des modifications substantielles

N’essayez pas d’amener les moteurs de recherche à réindexer les pages en mettant à jour votre heure de modification sans apporter de modifications substantielles à votre page.

Dans le passé, j’ai longuement parlé des dangers potentiels d’un référencement risqué .

Je ne vais pas réitérer tous mes points ici, mais il suffit de dire que Google peut commencer à supprimer vos horodatages s’ils sont constamment mis à jour sans fournir de nouvelle valeur.

10. N’incluez pas d’URL « noindex » dans votre sitemap

En parlant de budget d’exploration gaspillé, si les robots des moteurs de recherche ne sont pas autorisés à indexer certaines pages, alors ils n’ont rien à faire dans votre plan de site.

Lorsque vous soumettez un plan de site qui inclut des pages bloquées et « noindex », vous dites simultanément à Google « il est vraiment important que vous indexiez cette page » et « vous n’êtes pas autorisé à indexer cette page ».

Le manque de cohérence est une erreur courante.

11. Ne vous inquiétez pas trop des paramètres de priorité

Certains sitemaps ont une colonne « Priorité » qui indique ostensiblement aux moteurs de recherche quelles pages sont les plus importantes.

Cependant, le fait que cette fonctionnalité fonctionne réellement a longtemps été débattu.

En 2017, Gary Illyes de Google a tweeté que Googlebot ignorait les paramètres de priorité lors de l’exploration.

12. Ne laissez pas votre plan de site devenir trop gros

Plus votre plan de site est petit, moins vous mettez de pression sur votre serveur.

Google et Bing ont tous deux augmenté la taille des fichiers de plan de site acceptés de 10 Mo à 50 Mo et 50 000 URL par plan de site.

Bien que cela soit plus que suffisant pour la plupart des sites, certains webmasters devront diviser leurs pages en deux ou plusieurs sitemaps.

Par exemple, si vous gérez une boutique en ligne de 200 000 pages, vous devrez créer cinq plans de site distincts pour gérer tout cela.

13. Ne créez pas de plan de site si vous n’êtes pas obligé de le faire

N’oubliez pas que tous les sites Web n’ont pas besoin d’un plan du site.

Google peut trouver et indexer vos pages assez précisément.

Selon Mueller, le plan du site lui  même n’apporte pas la même valeur SEO à tout le monde .

Fondamentalement, si votre site Web est un portfolio/une page, ou s’il s’agit d’un site Web d’organisation que vous mettez rarement à jour, le plan du site n’est pas vraiment nécessaire.

Cependant, si vous publiez beaucoup de nouveau contenu et que vous souhaitez qu’il soit indexé dès que possible, ou si vous avez des centaines de milliers de pages (exécutant un site Web de commerce électronique, par exemple), alors un plan de site est toujours un excellent moyen de donner des informations directement à Google .