Usein kysytyt kysymykset
Miten edustan URL-osoitteita sivustokartassa?
Onko sivustokarttatiedostojeni luonnin yhteydessä käyttämälläni merkkikoodausmenetelmällä väliä?
Miten lasken viimeisen muutospäivämäärän?
Minne sijoitan sivustokarttani?
Miten suuri sivustokarttani voi olla?
Mitä teen sivustokartan luomisen jälkeen?
Onko sivustokartan URL-osoitteet määritettävä tarkasti?
Sivustoni URL-osoitteissa on http- ja https-versioita. Onko minun merkittävä molemmat?
Sivustoni URL-osoitteissa on istuntotunnukset. Onko minun poistettava ne?
Vaikuttaako URL-osoitteen sijainti sivustokartassa sen käyttöön?
Voinko pakata sivustokarttani zip-muodossa vai onko ne pakattava gzip-muodossa?
Muuttaako XML-sivustokartan "painoarvoa" koskeva vihje sivujeni sijoitusta hakutuloksissa?
Onko olemassa XML-kaavaa, jonka mukaan voin vahvistaa XML-sivustokarttani?
Entä jos minulla on kysyttävää protokollan käytöstä tai sivustokartan lähettämisestä?
Q: Miten edustan URL-osoitteita sivustokartassa?
Kaikkien XML-tiedostojen tapaan kaikissa data-arvoissa (URL-osoitteet mukaan lukien) on käytettävä ns. entity escape -koodeja seuraavien merkkien osalta: et-merkki (&), heittomerkki ('), lainausmerkki ("), pienempi kuin (<) ja suurempi kuin (>). Varmista myös, että kaikki URL-osoitteet noudattavat URI-osoitteiden RFC-3986-standardia, IRI-osoitteiden RFC-3987-standardia ja XML-standardia. Jos URL-osoitteet muodostetaan komentojonon avulla, tarvittava URL escape -koodaus voidaan tavallisesti määrittää käytettävään komentojonoon. Tämän lisäksi tiedot on saatettava entity escape -muotoon. Oheinen python-komentojono esimerkiksi muuttaa entity escape -muotoon lausekkeen http://www.esimerkki.fi/view?widget=3&count>2
$ python Python 2.2.2 (#1, Feb 24 2003, 19:13:11) >>> import xml.sax.saxutils >>> xml.sax.saxutils.escape("http://www.example.com/view?widget=3&count>2")
Edellä mainitun esimerkin mukaan saadaan seuraava URL-osoite:
http://www.example.com/view?widget=3&count>2
Q: Onko sivustokarttatiedostojeni luonnin yhteydessä käyttämälläni merkkikoodausmenetelmällä väliä?
Kyllä. Sivustokarttatiedostojesi on käytettävä UTF-8-koodausta.
Käytä W3C Datetime -merkistöä lastmod-aikaleimoissa ja kaikissa muissa tämän protokollan päivämäärissä ja ajoissa. Esimerkiksi 2004-09-22T14:12:14+00:00.
Koodauksen ansiosta voit ohittaa ISO8601-muodon kellonajan. Esimerkiksi 2004-09-22 on myös kelvollinen. Jos sivustosi muuttuu usein, sinun kannattaa kuitenkin sisällyttää kellonaika, jotta indeksoijilla olisi kattavammat tiedot sivustostasi.
Q: Miten lasken viimeisen muutospäivämäärän?
Staattisten tiedostojen osalta tämä on tiedoston todellinen päivityspäivämäärä. Voit käyttää UNIX -päivämääräkomentoa saadaksesi seuraavan päivämäärän:
$ date --iso-8601=seconds -u -r /home/foo/www/bar.html >> 2004-10-26T08:56:39+00:00
Voit helposti laskea useiden dynaamisten URL-osoitteiden viimeisimmän muutospäivän perustana olevien tietojen muutosajankohdan tai joidenkin ajoittaisiin päivityksiin (mikäli sellaisia on) perustuvien arvioiden perusteella. Jopa päivämäärää koskeva arvio tai aikaleima voi auttaa indeksoijia välttämään muuttamattomien URL-osoitteiden indeksoinnin. Tämä vähentää Web-palvelimiesi kaistanleveys- ja keskusyksikkövaatimuksia.
Q: Minne sivustokartta sijoitetaan?
On erittäin suositeltavaa, että sivustokartta sijoitetaan HTML-palvelimen päätasolle eli seuraavasti http://esimerkki.fi/sitemap.xml.
Joissakin tilanteissa haluat ehkä luoda erilaisia sivustokarttoja sivustosi eri polkuihin, kuten silloin, kun organisaatiosi suojaluvat jakavat eri hakemistojen kirjoitusoikeudet osiin.
Oletamme, että jos käyttäjällä on oikeus ladata http://esimerkki.fi/path/sitemap.xml palvelimelle, hänellä on myös oikeudet metatietojen raportointiin osoitteessa http://esimerkki.fi/path/
Kaikkien sivustokartassa olevien URL-osoitteiden on oltava sivustokartan kanssa samalla palvelimella. Jos sivustokartta on esimerkiksi osoitteessa http://www.esimerkki.fi/sitemap.xml, se ei voi sisältää URL-osoitteita osoitteesta http://aliverkkotunnus.esimerkki.fi. Jos sivustokartta sijaitsee osoitteessa http://www.esimerkki.fi/omakansio/sitemap.xml, se ei voi sisältää URL-osoitteita osoitteesta http://www.esimerkki.fi.
Q: Miten suuri sivustokarttani voi olla?
Sivustokarttojen koon tulisi olla enintään 50 Mt (52 428 800 tavua) ja ne voivat sisältää enintään 50 000 URL-osoitetta. Näiden rajoitusten ansiosta käytettävän verkkopalvelimen kapasiteetti ei lopu erittäin suurten tiedostojen käsittelyn yhteydessä. Tämä tarkoittaa, että jos sivusto koostuu yli 50 000 URL-osoitteesta, tai jos sivustokartan koko on yli 50 Mt, on luotava useita sivustokarttatiedostoja ja käytettävä sivustokarttahakemistotiedostoa. Sivustokarttahakemistotiedostoa on käytettävä myös silloin, kun sivusto on kooltaan pieni, mutta suunnitelmissa on nostaa URL-osoitteiden määrää yli 50 000:een tai kokoa yli 50 megatavuun. Sivustokarttahakemistotiedosto voi sisältää enintään 50 000 sivustokarttaa. Sen enimmäiskoko on 50 Mt (52 428 800 tavua). Voit pakata sivustokarttasi gzip-muodossa.
Q: Sivustossani on kymmeniä miljoonia URL-osoitteita; voinko kuitenkin lähettää vain äskettäin muuttamani URL-osoitteet?
Voit lisätä usein päivitettävät URL-osoitteet pieneen joukkoon sivustokarttoja ja määrittää sitten kyseiset sivustokarttatiedostot käyttämällä lastmod-koodia sivustokarttahakemistotiedostossa. Tämän jälkeen hakukoneet voivat indeksoida vain muuttuneet sivustokartat.
Q: Mitä teen sivustokartan luomisen jälkeen?
Kun olet luonut sivustokarttatiedoston, kerro siitä hakukoneille lähettämällä se suoraan niille, lähettämällä niille tiedustelupaketti tai lisäämällä sivustokarttasi sijainti robots.txt-tiedostoosi.
Q: Onko sivustokartan URL-osoitteet määritettävä tarkasti?
Kyllä. Protokolla (esimerkiksi http) on lisättävä URL-osoitteeseen. Lisää URL-osoitteen perään myös kauttaviiva, mikäli verkkopalvelin tätä edellyttää. Esimerkiksi osoite http://www.esimerkki.fi/ on sivustokarttaan kelpaava URL-osoite kun taas www.esimerkki.fi ei ole.
Q: Sivustoni URL-osoitteissa on http- ja https-versioita. Onko minun merkittävä molemmat?
Ei. Merkitse sivustokarttoihisi vain yksi URL-osoiteversio. Jos sisällytät useita URL-osoiteversioita, sivustoasi ei voida ehkä indeksoida kunnolla.
Q: Sivustoni URL-osoitteissa on istuntotunnukset. Onko minun poistettava ne?
Kyllä. Istuntotunnusten sisällyttäminen URL-osoitteisiin voi johtaa sivustosi vaillinaiseen ja turhaan indeksointiin.
Q: Vaikuttaako URL-osoitteen sijainti sivustokartassa sen käyttöön?
Ei. URL-osoitteen sijainti sivustokartassa ei todennäköisesti vaikuta siihen, miten hakukoneet käyttävät sitä tai ottavat sen huomioon.
Q: Jotkut sivustoni sivut käyttävät kehyksiä. Lisäänkö kehyssivujen URL-osoitteet vai kehysten sisältöjen URL-osoitteet?
Sisällytä molemmat URL-osoitteet.
Q: Voinko pakata sivustokarttani zip-muodossa vai onko ne pakattava gzip-muodossa?
Pakkaa sivustokarttasi gzip-muodossa. Muista, että sivustokarttasi ei saa pakattunakaan olla suurempi kuin 50 Mt (52 428 800 tavua).
Q: Muuttaako XML-sivustokartan painoarvoa (priority) koskeva vihje sivujeni sijoitusta hakutuloksissa?
Sivustokarttasi "priority"-vihje osoittaa vain tietyn URL-osoitteen merkityksen suhteessa muihin URL-osoitteisiin omassa sivustossasi, eikä vaikuta sivujesi sijoitukseen hakutuloksissa.
Q: Onko olemassa XML-kaavaa, jonka mukaan voin vahvistaa XML-sivustokarttani?
Kyllä. Sivustokarttatiedostojen XML-kaava on saatavissa osoitteessa http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd ja sivustokarttahakemistotiedostojen kaava on saatavissa osoitteessa http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd. Katso myös lisätietoja sivustokartan vahvistamisesta.
Q: Entä jos minulla on kysyttävää protokollan käytöstä tai sivustokartan lähettämisestä?
Katso lisätietoja sivustokarttojen lähettämisestä ja käytöstä kunkin hakukoneen dokumentaatiosta.
Viimeisin päivitys: 21.11.2016