Foire aux questions

Comment dois-je représenter les URL dans le plan Sitemap ?

La méthode de codage des caractères importe-t-elle pour générer mes fichiers Sitemap ?

Comment puis-je indiquer l'heure ?

Comment puis-je calculer la date de la dernière modification (lastmod) ?

Où dois-je placer mon plan Sitemap ?

Quelle peut être la taille maximum de mon plan Sitemap ?

Mon site se compose de dizaines de millions d'URL. Puis-je envoyer uniquement celles qui ont changé récemment ?

Que dois-je faire après avoir créé mon plan Sitemap ?

Les URL du plan Sitemap doivent-elles être entièrement définies ?

Les URL de mon site existent en version "http" et "https". Dois-je les répertorier sous les deux formes ?

Les URL de mon site incluent des identifiants de session. Dois-je supprimer ces identifiants ?

La position d'une URL dans un plan Sitemap a-t-elle une incidence sur son utilisation ?

Certaines des pages de mon site utilisent des cadres. Dois-je inclure les URL des jeux de cadres (frameset) ou celles du contenu des cadres ?

Puis-je compresser mes plans Sitemap à l'aide de n'importe quel utilitaire ou dois-je utiliser gzip ?

L'indication "priority" du plan Sitemap XML modifie-t-elle le classement de mes pages dans les résultats de recherche ?

Existe-t-il un schéma XML que je pourrais utiliser en référence pour valider mon plan Sitemap XML ?

Que dois-je faire si j'ai d'autres questions sur l'utilisation du protocole ou l'envoi d'un plan Sitemap ?


Q : Comment dois-je représenter les URL dans le plan Sitemap ?

Comme pour tous les fichiers XML, les valeurs de données (URL comprises) doivent utiliser des codes d'échappement d'entité pour les caractères suivants : perluète (&), apostrophe ('), guillemets droits (") et signes inférieur à (<) et supérieur à (>). Vous devez également vous assurer que toutes les URL respectent la norme RFC-3986 de définition des URI, la norme RFC-3987 de définition des IRI et la norme XML. Si vous utilisez un script pour générer vos URL, vous pouvez généralement intégrer la gestion des caractères d'échappement d'URL dans le script. Toutefois, vous devrez ensuite insérer les caractères d'échappement d'entité nécessaires. Par exemple, le script python suivant utilise des caractères d'échappement d'entité pour l'URL http://www.exemple.fr/view?widget=3&count>2.

$ python
Python 2.2.2 (#1, Feb 24 2003, 19:13:11)  
>>> import xml.sax.saxutils
>>> xml.sax.saxutils.escape("http://www.example.com/view?widget=3&count>2")

L'URL obtenue dans l'exemple ci-dessus se présente ainsi :

http://www.example.com/view?widget=3&amp;count&gt;2

Q : La méthode de codage des caractères importe-t-elle pour générer mes fichiers Sitemap ?

Oui. Vos fichiers Sitemap doivent utiliser un codage UTF-8.

Q : Comment puis-je indiquer l'heure ?

Utilisez le codage des dates et heures du W3C pour fournir les horodatages lastmod et toutes les autres dates et heures de ce protocole. Par exemple, 2004-09-22T14:12:14+00:00.

Ce codage vous permet d'omettre la partie du format ISO8601 correspondant à l'heure. Ainsi, la valeur 2004-09-22 est également valide. Toutefois, si votre site est fréquemment actualisé, nous vous invitons à inclure l'heure afin de fournir aux robots d'exploration des informations plus complètes sur votre site.

Q : Comment puis-je calculer la date de la dernière modification (lastmod) ?

Pour les fichiers statiques, il s'agit de la date de mise à jour effective du fichier. Pour l'obtenir, vous pouvez utiliser la commande UNIX date :

$ date --iso-8601=seconds -u -r /home/foo/www/bar.html
>> 2004-10-26T08:56:39+00:00

Pour de nombreuses URL dynamiques, vous devriez être en mesure de calculer la date de la dernière modification (lastmod) à partir de la date à laquelle les données sous-jacentes ont changé ou par une approximation fondée sur des dates de mise à jour périodiques (le cas échéant). L'utilisation d'une date ou d'un horodatage, même approximatifs, peut aider les robots d'exploration à éviter les URL qui n'ont pas changé. Vous réduisez ainsi les besoins en termes de bande passante et de puissance des processeurs de vos serveurs Web.

Q : Où dois-je placer mon plan Sitemap ?

Il est vivement recommandé de placer votre plan Sitemap dans le répertoire racine de votre serveur HTML, soit, par exemple, à l'adresse http://exemple.fr/sitemap.xml.

Dans certaines situations, vous pouvez définir un plan Sitemap distinct pour les différents chemins de votre site. C'est le cas, par exemple, si le paramétrage de sécurité en vigueur dans votre entreprise définit séparément les droits d'accès en écriture aux différents répertoires.

Si vous disposez des droits pour transférer http://exemple.fr/path/sitemap.xml, vous pourrez normalement fournir des métadonnées sous http://exemple.fr/path/.

Toutes les URL répertoriées dans le plan Sitemap doivent être hébergées sur le même site que le plan correspondant. Par exemple, si le plan Sitemap figure sous http://www.exemple.fr/sitemap.xml, il ne peut pas contenir d'URL stockées à l'adresse http://sous-domaine.exemple.fr. Si le plan Sitemap figure sous http://www.exemple.fr/mondossier/sitemap.xml, il ne peut pas contenir d'URL stockées à l'adresse http://www.exemple.fr.

Retour au début

Q : Quelle peut être la taille maximum de mon plan Sitemap ?

La taille des plans Sitemap ne doit pas excéder 50 Mo (52 428 800 octets) et le nombre d'URL est limité à 50 000. Ces limites contribuent à éviter la surcharge de votre serveur Web lors du traitement de fichiers volumineux. Cela signifie que si votre site contient plus de 50 000 URL ou que la taille de votre plan Sitemap est supérieure à 50 Mo, vous devez créer plusieurs fichiers Sitemap et utiliser un fichier d'index Sitemap. Quelle que soit la taille de votre site, vous devez utiliser un fichier d'index Sitemap si vous envisagez d'y inclure plus de 50 000 URL ou si la taille du fichier est susceptible d'excéder 50 Mo. Un fichier d'index Sitemap peut contenir jusqu'à 50 000 plans Sitemap et ne doit pas excéder 50 Mo (52 428 800 octets). Vous pouvez également utiliser l'utilitaire gzip pour compresser vos plans Sitemap.

Q : Mon site se compose de dizaines de millions d'URL. Comment puis-je envoyer uniquement celles qui ont changé récemment ?

Vous pouvez répertorier les URL qui changent fréquemment dans un petit nombre de plans Sitemap, puis utiliser la balise lastmod dans votre fichier d'index Sitemap pour identifier ces fichiers Sitemap. Les moteurs de recherche procèderont alors à une exploration différentielle des seuls plans Sitemap qui ont changé.

Q : Que dois-je faire après avoir créé mon plan Sitemap ?

Une fois votre plan Sitemap créé, informez les moteurs de recherche de sa création en le leur envoyant directement, en leur envoyant une commande "ping" ou en ajoutant l'emplacement de votre plan dans votre fichier robots.txt.

Q : Les URL du plan Sitemap doivent-elles être entièrement définies ?

Oui. Vous devez inclure le protocole (par exemple, http) dans votre URL. Vous devez impérativement inclure une barre oblique finale dans votre URL si votre serveur Web le requiert. Par exemple, http://www.exemple.fr/ est une URL valide de plan Sitemap, ce qui n'est pas le cas de www.exemple.fr.

Q : Les URL de mon site existent en version "http" et "https". Dois-je les répertorier sous les deux formes ?

Non. Vous ne devez inclure qu'une seule version de chaque URL dans vos plans Sitemap. La présence de plusieurs versions des mêmes URL peut entraîner une exploration incomplète de votre site.

Q : Les URL de mon site incluent des identifiants de session. Dois-je supprimer ces identifiants ?

Oui. La présence des ID de session dans les URL peut entraîner une exploration incomplète et redondante de votre site.

Q : La position d'une URL dans un plan Sitemap a-t-elle une incidence sur son utilisation ?

Non. Le positionnement d'une URL dans le plan Sitemap n'a qu'une très faible probabilité d'avoir une quelconque incidence sur la façon dont les moteurs de recherche utilisent ou considèrent cette URL.

Q : Certaines des pages de mon site utilisent des cadres. Dois-je inclure les URL des jeux de cadres (frameset) ou celles du contenu des cadres ?

Veuillez inclure les deux URL.

Q : Puis-je compresser mes plans Sitemap à l'aide de n'importe quel utilitaire ou dois-je utiliser gzip ?

Utilisez gzip pour compresser vos plans Sitemap. Notez que la taille de votre plan Sitemap ne doit pas excéder 50 Mo (52 428 800 octets), qu'il soit compressé ou non.

Q : L'indication "priority" du plan Sitemap XML modifie-t-elle le classement de mes pages dans les résultats de recherche ?

Le terme "priority" figurant dans votre plan Sitemap indique uniquement l'importance d'une URL par rapport aux autres URL affichées sur votre propre site et n'a aucun effet sur le classement de vos pages dans les résultats de recherche.

Q : Existe-t-il un schéma XML que je pourrais utiliser en référence pour valider mon plan Sitemap XML ?

Oui. Vous trouverez un schéma XML des fichiers Sitemap sur la page http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd et un schéma des fichiers d'index Sitemap sur la page http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd. Pour plus d'informations sur la validation de votre plan Sitemap, cliquez ici.

Q : Que dois-je faire si j'ai d'autres questions sur l'utilisation du protocole ou l'envoi d'un plan Sitemap ?

Pour plus d'informations sur l'envoi et l'utilisation d'un plan Sitemap, consultez la documentation disponible auprès des différents moteurs de recherche.

Retour au début

Dernière mise à jour : 21 novembre 2016