Najczęściej zadawane pytania

Jak przedstawić adresy URL w mapie witryny?

Czy metoda kodowania znaków używana do generowania plików map witryn ma znaczenie?

Jak określić czas?

Jak obliczyć datę lastmod?

Gdzie umieścić mapę witryny?

Jak duża może być mapa witryny?

Moja witryna zawiera dziesiątki milionów adresów URL. Czy jest jakiś sposób umożliwiający przesłanie tylko tych, które zostały ostatnio zmienione?

Co należy zrobić po utworzeniu mapy witryny?

Czy trzeba podawać pełne adresy URL w mapie witryny?

Moja witryna ma adresy URL zarówno w wersji „http”, jak i „https”. Czy trzeba podać obie wersje?

Adresy URL w mojej witrynie zawierają identyfikatory sesji. Czy trzeba je usunąć?

Czy pozycja adresu URL w mapie witryny ma wpływ na jego użytkowanie?

Na niektórych stronach w mojej witrynie stosowane są ramki. Czy muszę podać adresy URL zestawów ramek, czy adresy URL treści ramek?

Czy mogę skompresować mapy witryn w formacie zip, czy też muszą one mieć format gzip?

Czy wskazówka „priority” w mapie witryny w formacie XML zmienia ranking moich stron w wynikach wyszukiwania?

Czy jest dostępny schemat XML służący do sprawdzania poprawności mapy witryny w formacie XML?

Co zrobić, jeśli mam inne pytanie na temat używania protokołu lub zgłaszania mapy witryny?


P. Jak przedstawić adresy URL w mapie witryny?

Tak jak w przypadku wszystkich plików XML, wszelkie wartości danych (włącznie z adresami URL) muszą zawierać kody ucieczki encji następujących znaków: znak „&”, pojedynczy cudzysłów ('), podwójny cudzysłów ("), znak mniejszości (<) i znak większości (>). Należy również sprawdzić, czy wszystkie adresy URL są zgodne ze standardem RFC-3986 dla identyfikatorów URI, standardem RFC-3987 dla identyfikatorów IRI i standardem XML. Jeśli do generowania adresów URL używasz skryptu, możesz zastosować w nich kody ucieczki URL za pomocą skryptu. Konieczne będzie zastosowanie kodów ucieczki encji. Na przykład poniższy skrypt w języku Python wstawia kody ucieczki encji http://www.przyklad.com/view?widget=3&count>2

$ python
Python 2.2.2 (#1, Feb 24 2003, 19:13:11)  
>>> import xml.sax.saxutils
>>> xml.sax.saxutils.escape("http://www.example.com/view?widget=3&count>2")

Wynikowy adres URL z powyższego przykładu to:

http://www.example.com/view?widget=3&amp;count&gt;2

P. Czy metoda kodowania znaków używana do generowania plików map witryn ma znaczenie?

Tak. Pliki map witryn muszą mieć kodowanie UTF-8.

P. Jak określić czas?

Zastosuj kodowanie W3C Datetime do sygnatur czasowych parametru lastmod i wszystkich innych dat i godzin w tym protokole. Przykład: 2004-09-22T14:12:14+00:00.

To kodowanie umożliwia pominięcie wartości godziny w formacie ISO8601; na przykład wartość 2004-09-22 jest także prawidłowa. Jeśli jednak Twoja witryna jest często zmieniana, zachęcamy do uwzględnienia wartości godziny, aby podawać robotom indeksującym pełniejsze informacje o witrynie.

P. Jak obliczyć datę lastmod?

W przypadku plików statycznych jest to rzeczywista data aktualizacji pliku. Aby uzyskać tę datę, można użyć polecenia systemu UNIX „date”:

$ date --iso-8601=seconds -u -r /home/foo/www/bar.html
>> 2004-10-26T08:56:39+00:00

W przypadku wielu dynamicznych adresów URL można z łatwością obliczyć datę lastmod na podstawie daty zmiany danych źródłowych lub stosując przybliżenia oparte na aktualizacjach okresowych (jeśli są stosowane). Użycie nawet przybliżonej daty lub sygnatury czasowej ułatwi robotom indeksującym uniknięcie indeksowania adresów URL, które się nie zmieniły. Zmniejszy to obciążenie łącza sieciowego i procesorów Twoich serwerów internetowych.

P. Gdzie umieścić mapę witryny?

Zaleca się umieszczenie mapy witryny w katalogu głównym serwera HTML, czyli w ścieżce http://przyklad.com/sitemap.xml.

W niektórych sytuacjach można wygenerować różne mapy witryn dla różnych ścieżek w witrynie — na przykład, jeśli uprawnienia zabezpieczeń w organizacji dzielą użytkowników na różne kategorie pod względem praw zapisu w różnych katalogach.

Przyjmujemy, że skoro masz uprawnienia do przesłania na serwer pliku http://przyklad.com/path/sitemap.xml, to masz również uprawnienia do zgłaszania metadanych w ścieżce http://przyklad.com/path/.

Wszystkie adresy URL zawarte w mapie witryny muszą znajdować się na tym samym serwerze, co mapa witryny. Jeśli mapa witryny znajduje się na przykład w lokalizacji http://www.przyklad.com//sitemap.xml, nie może ona zawierać adresów URL z lokalizacji http://poddomena.przyklad.com. Jeśli mapa witryny znajduje się w lokalizacji http://www.przyklad.com/mójfolder/sitemap.xml, nie może zawierać adresów URL z lokalizacji http://www.przyklad.com.

Powrót na początek

P. Jak duża może być mapa witryny?

Rozmiar map witryn nie może przekraczać 50 MB (52 428 800 bajtów). Mapa witryny może zawierać co najwyżej 50 000 adresów URL. Te limity gwarantują że Twój serwer internetowy nie zostanie przeciążony, obsługując bardzo duże pliki. To znaczy, że jeśli witryna zawiera więcej niż 50 000 adresów URL lub rozmiar mapy witryny przekracza 50 MB, należy utworzyć wiele plików map witryn i użyć pliku indeksu map witryn. Pliku indeksu map witryn należy użyć nawet w przypadku mniejszych witryn, jeśli planowany jest ich rozwój powyżej 50 000 adresów URL lub oczekiwany jest wzrost rozmiaru pliku do ponad 50 MB. Plik indeksu map witryn może zawierać listę maksimum 50000 map witryn, a jego rozmiar nie może przekraczać 50 MB (52 428 800 bajtów). Do skompresowania map witryn można również użyć kompresora gzip.

P. Moja witryna zawiera dziesiątki milionów adresów URL. Czy jest jakiś sposób umożliwiający przesłanie tylko tych, które zostały ostatnio zmienione?

Często zmieniające się adresy URL można podać w kilku małych mapach witryn, a następnie za pomocą tagu lastmod w pliku indeksu map witryn wskazać te pliki map witryn. Wyszukiwarki mogą wówczas przyrostowo indeksować tylko zmienione mapy witryn.

P. Co należy zrobić po utworzeniu mapy witryny?

Po utworzeniu mapy witryny należy poinformować o niej wyszukiwarki, zgłaszając mapę witryny bezpośrednio w wyszukiwarkach, wysyłając pakiety ping do wyszukiwarek lub podając lokalizację mapy witryny w pliku robots.txt.

P. Czy trzeba podawać pełne adresy URL w mapie witryny?

Tak. W adresie URL należy uwzględnić przedrostek określający protokół (na przykład http). Należy również dołączyć na końcu adresu URL kreskę ułamkową, jeśli wymaga tego Twój serwer internetowy. Adres http://www.przyklad.com/ jest na przykład prawidłowym adresem URL mapy witryny, w odróżnieniu od adresu www.przyklad.com.

P. Moja witryna ma adresy URL zarówno w wersji „http”, jak i „https”. Czy trzeba podać obie wersje?

Nie. Podaj tylko jedną wersję adresu URL w mapach witryny. Podanie wielu wersji adresów URL może skutkować niepełnym zaindeksowaniem witryny.

P. Adresy URL w mojej witrynie zawierają identyfikatory sesji. Czy trzeba je usunąć?

Tak. Podanie identyfikatorów sesji w adresach URL może skutkować niepełnym i zduplikowanym zaindeksowaniem witryny.

P. Czy pozycja adresu URL w mapie witryny ma wpływ na jego użytkowanie?

Nie. Pozycja adresu URL w mapie witryny nie ma zazwyczaj żadnego wpływu na sposób jego używania ani traktowania przez wyszukiwarki.

P. Na niektórych stronach w mojej witrynie stosowane są ramki. Czy muszę podać adresy URL zestawów ramek, czy adresy URL treści ramek?

Podaj oba adresy URL.

P. Czy mogę skompresować mapy witryn w formacie zip, czy też muszą one mieć format gzip?

Użyj kompresora gzip do skompresowania map witryn. Pamiętaj, że rozmiar mapy witryny, skompresowanej lub nieskompresowanej, nie może przekraczać 50 MB (52 428 800 bajtów).

P. Czy wskazówka „priority” w mapie witryny w formacie XML zmienia ranking moich stron w wynikach wyszukiwania?

Wskazówka "priority" w mapie witryny wskazuje jedynie wagę danego adresu URL w odniesieniu do innych adresów URL w Twojej własnej witrynie i nie ma żadnego wpływu na pozycję Twoich stron w rankingu wyników wyszukiwania.

P. Czy jest dostępny schemat XML służący do sprawdzania poprawności mapy witryny w formacie XML?

Tak. Schemat XML plików map witryn jest dostępny pod adresem http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd, a schemat plików indeksu map witryn jest dostępny pod adresem http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd. Więcej informacji o sprawdzaniu poprawności mapy witryny.

P. Co zrobić, jeśli mam inne pytanie na temat używania protokołu lub zgłaszania mapy witryny?

Szczegółowe informacje na temat zgłaszania i stosowania map witryn zawiera dokumentacja poszczególnych wyszukiwarek.

Powrót na początek

Ostatnia aktualizacja: 21 listopad 2016 r.