loader

Le terme « sitemaps » est probablement familier à la plupart des gens. Après tout, presque tous les sites Web ont un lien vers une telle table des matières dans le pied de page. Cependant, il existe d’autres plans de site qu’un opérateur de site Web devrait connaître. Ceux-ci incluent des sitemaps XML qui ne sont accessibles qu’au webmaster et nécessitent des connaissances techniques.

Que représentent les sitemaps XML ?

Un moteur de recherche peut recevoir une liste complète d’URL situées sur un domaine à l’aide d’un sitemap XML. L’indexation de l’URL avec un moteur de recherche comme Google est facilitée par un sitemap. Même les contenus difficiles à indexer peuvent être signalés avec. Afin de garantir un traitement sans erreur par les robots des moteurs de recherche, des spécifications individuelles doivent cependant être respectées en fonction de l’application.

Le sitemap XML doit être rendu lisible par machine afin que les moteurs de recherche puissent tout lire et interpréter correctement. De plus, un sitemap XML doit être répertorié dans le répertoire racine du site Web afin d’être trouvé et lu par les moteurs de recherche. Les webmasters qui travaillent avec Google Webmaster Tools peuvent les utiliser pour intégrer le plan du site. Ces outils sont très utiles pour détecter les faiblesses de l’indexation et contrôler l’indexation.

Le plan du site est enregistré sous forme de fichier au format XML. Chaque URL du site Web y sera répertoriée. Afin d’envoyer toutes les URL au moteur de recherche et de pouvoir suivre l’indexation, le sitemap est simplement téléchargé sur la Search Console. Les paramètres attribués à l’URL respective indiquent à Google and Co. comment interagir avec la page respective. Bien sûr, d’autres éléments pertinents doivent également être pris en compte pour la stratégie de moteur de recherche correspondante, comme l’influence du nom de domaine sur le référencement.

Sitemaps XML – autres éléments pertinents pour la stratégie de référencement

En plus du sitemap XML, les éléments suivants peuvent être pertinents pour la stratégie SEO et l’indexation :

    • La priorité indique aux moteurs de recherche quelles URL doivent être prioritaires lors de l’exploration du site Web. Bien que les moteurs de recherche comme Google ne tiennent généralement pas compte de cela, il est toujours important de présenter un site Web bien structuré. Un moteur de recherche vérifie généralement le fichier robots.txt, puis continue son exploration. Cependant, cette action n’a aucune influence sur le placement.
    • Les sites Web qui utilisent Change fréquemment  indiquent aux moteurs de recherche à quelle fréquence cliquer sur une autre page. Le bot visitera alors cette page plus souvent que les autres URL.
    • La page respective a été logiquement modifiée pour la dernière fois. Sans Lastmod, cependant, les moteurs de recherche y prêteront peu d’attention. Les seules exceptions sont les sites Web qui affichent un journal numérique ou peuvent proposer les dernières nouvelles.

 

Qu’est-ce qui est spécifié dans le sitemap XML ?

Les sitemaps XML contiennent diverses informations obligatoires ainsi que des attributs facultatifs. Un must clair sont:

    • chaque entrée est associée à une balise parent
    • une référence au protocole standard
    • une référence à l’URL

Des attributs facultatifs peuvent être ajoutés :

    • Pertinence de l’URL
    • Fréquence des changements de contenu
    • date de la dernière mise à jour

Existe-t-il une limite à la spécification des URL dans un sitemap XML ?

En principe, un fichier XML ne doit pas dépasser 10 mégaoctets. Cela limite le nombre d’URL pouvant être spécifiées par sitemap XML à 50 000 entrées. Une limite que les utilisateurs normaux d’hébergement Web n’atteignent généralement jamais. Mais si vous travaillez sur de très gros projets web, comme des boutiques en ligne professionnelles, vous devez souvent prévoir plusieurs fichiers XML. Il est logique de les classer par catégorie. Cela facilite l’organisation d’un site Web.

Étant donné que plusieurs fichiers XML sont avantageux, la restriction d’URL peut être utilisée comme une bonne excuse lorsque vous essayez d’organiser des groupes de pages. Mais pourquoi est-il judicieux de trier les pages par groupes ? Les sitemaps XML segmentés peuvent être facilement vérifiés pour l’indexation à l’aide de Google Search Console. Les faiblesses sont si faciles à repérer. Si l’indexation d’une page se perd dans une catégorie, le problème peut bien sûr être identifié plus facilement dans une zone plus restreinte. Le simple fait de regarder la situation dans son ensemble peut rendre difficile de comprendre ce qui cause le déclin mondial. Il est également beaucoup plus facile d’analyser les sites Web par catégorie et d’identifier les tendances. Il est donc plus facile de développer des stratégies et d’identifier des technologies efficaces afin qu’elles puissent ensuite être utilisées sur d’autres sites Web.

Dans le meilleur des cas, chaque site Web devrait avoir au moins un sitemap XML. Peu importe qu’il s’agisse d’un grand ou d’un petit site Web. Enfin, le plan du site permet de ne pas perdre de vue le site Web. Un aperçu du nombre d’URL existantes et de leur indexation est fourni. S’il s’agit d’un très grand site Web avec plus de 50 000 URL, non seulement plusieurs sitemaps, mais également un index de sitemap sont nécessaires.

Comment faire en sorte que Google trouve un sitemap XML ?

Après avoir créé le ou les fichiers XML, le plan du site peut être téléchargé sur Google Webmaster Tools. Cela va commencer l’indexation. Le webmaster voit l’augmentation du nombre de pages indexées et peut immédiatement reconnaître des baisses plus importantes. Il convient de noter que chaque moteur de recherche vérifie d’abord le fichier robots.txt après avoir trouvé un site Web sur Internet. Si le plan du site XML doit être trouvé facilement, l’URL du plan du site doit également être stockée dans ce fichier.

Crédit photo : Gerd Altmann sur Pixabay

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *