Usein kysytyt kysymykset

Miten edustan URL-osoitteita sivustokartassa?

Onko sivustokarttatiedostojeni luonnin yhteydessä käyttämälläni merkkikoodausmenetelmällä väliä?

Miten määritän ajan?

Miten lasken viimeisen muutospäivämäärän?

Minne sijoitan sivustokarttani?

Miten suuri sivustokarttani voi olla?

Sivustossani on kymmeniä miljoonia URL-osoitteita; voinko kuitenkin lähettää vain äskettäin muuttamani URL-osoitteet?

Mitä teen sivustokartan luomisen jälkeen?

Onko sivustokartan URL-osoitteet määritettävä tarkasti?

Sivustoni URL-osoitteissa on http- ja https-versioita. Onko minun merkittävä molemmat?

Sivustoni URL-osoitteissa on istuntotunnukset. Onko minun poistettava ne?

Vaikuttaako URL-osoitteen sijainti sivustokartassa sen käyttöön?

Jotkut sivustoni sivut käyttävät kehyksiä. Lisäänkö kehyssivujen URL-osoitteet vai kehysten sisältöjen URL-osoitteet?

Voinko pakata sivustokarttani zip-muodossa vai onko ne pakattava gzip-muodossa?

Muuttaako XML-sivustokartan "painoarvoa" koskeva vihje sivujeni sijoitusta hakutuloksissa?

Onko olemassa XML-kaavaa, jonka mukaan voin vahvistaa XML-sivustokarttani?

Entä jos minulla on kysyttävää protokollan käytöstä tai sivustokartan lähettämisestä?


Q: Miten edustan URL-osoitteita sivustokartassa?

Kaikkien XML-tiedostojen tapaan kaikissa data-arvoissa (URL-osoitteet mukaan lukien) on käytettävä ns. entity escape -koodeja seuraavien merkkien osalta: et-merkki (&), heittomerkki ('), lainausmerkki ("), pienempi kuin (<) ja suurempi kuin (>). Varmista myös, että kaikki URL-osoitteet noudattavat URI-osoitteiden RFC-3986-standardia, IRI-osoitteiden RFC-3987-standardia ja XML-standardia. Jos URL-osoitteet muodostetaan komentojonon avulla, tarvittava URL escape -koodaus voidaan tavallisesti määrittää käytettävään komentojonoon. Tämän lisäksi tiedot on saatettava entity escape -muotoon. Oheinen python-komentojono esimerkiksi muuttaa entity escape -muotoon lausekkeen http://www.esimerkki.fi/view?widget=3&count>2

$ python
Python 2.2.2 (#1, Feb 24 2003, 19:13:11)  
>>> import xml.sax.saxutils
>>> xml.sax.saxutils.escape("http://www.example.com/view?widget=3&count>2")

Edellä mainitun esimerkin mukaan saadaan seuraava URL-osoite:

http://www.example.com/view?widget=3&amp;count&gt;2

Q: Onko sivustokarttatiedostojeni luonnin yhteydessä käyttämälläni merkkikoodausmenetelmällä väliä?

Kyllä. Sivustokarttatiedostojesi on käytettävä UTF-8-koodausta.

Q: Miten määritän ajan?

Käytä W3C Datetime -merkistöä lastmod-aikaleimoissa ja kaikissa muissa tämän protokollan päivämäärissä ja ajoissa. Esimerkiksi 2004-09-22T14:12:14+00:00.

Koodauksen ansiosta voit ohittaa ISO8601-muodon kellonajan. Esimerkiksi 2004-09-22 on myös kelvollinen. Jos sivustosi muuttuu usein, sinun kannattaa kuitenkin sisällyttää kellonaika, jotta indeksoijilla olisi kattavammat tiedot sivustostasi.

Q: Miten lasken viimeisen muutospäivämäärän?

Staattisten tiedostojen osalta tämä on tiedoston todellinen päivityspäivämäärä. Voit käyttää UNIX -päivämääräkomentoa saadaksesi seuraavan päivämäärän:

$ date --iso-8601=seconds -u -r /home/foo/www/bar.html
>> 2004-10-26T08:56:39+00:00

Voit helposti laskea useiden dynaamisten URL-osoitteiden viimeisimmän muutospäivän perustana olevien tietojen muutosajankohdan tai joidenkin ajoittaisiin päivityksiin (mikäli sellaisia on) perustuvien arvioiden perusteella. Jopa päivämäärää koskeva arvio tai aikaleima voi auttaa indeksoijia välttämään muuttamattomien URL-osoitteiden indeksoinnin. Tämä vähentää Web-palvelimiesi kaistanleveys- ja keskusyksikkövaatimuksia.

Q: Minne sivustokartta sijoitetaan?

On erittäin suositeltavaa, että sivustokartta sijoitetaan HTML-palvelimen päätasolle eli seuraavasti http://esimerkki.fi/sitemap.xml.

Joissakin tilanteissa haluat ehkä luoda erilaisia sivustokarttoja sivustosi eri polkuihin, kuten silloin, kun organisaatiosi suojaluvat jakavat eri hakemistojen kirjoitusoikeudet osiin.

Oletamme, että jos käyttäjällä on oikeus ladata http://esimerkki.fi/path/sitemap.xml palvelimelle, hänellä on myös oikeudet metatietojen raportointiin osoitteessa http://esimerkki.fi/path/

Kaikkien sivustokartassa olevien URL-osoitteiden on oltava sivustokartan kanssa samalla palvelimella. Jos sivustokartta on esimerkiksi osoitteessa http://www.esimerkki.fi/sitemap.xml, se ei voi sisältää URL-osoitteita osoitteesta http://aliverkkotunnus.esimerkki.fi. Jos sivustokartta sijaitsee osoitteessa http://www.esimerkki.fi/omakansio/sitemap.xml, se ei voi sisältää URL-osoitteita osoitteesta http://www.esimerkki.fi.

Sivun alkuun

Q: Miten suuri sivustokarttani voi olla?

Sivustokarttojen koon tulisi olla enintään 50 Mt (52 428 800 tavua) ja ne voivat sisältää enintään 50 000 URL-osoitetta. Näiden rajoitusten ansiosta käytettävän verkkopalvelimen kapasiteetti ei lopu erittäin suurten tiedostojen käsittelyn yhteydessä. Tämä tarkoittaa, että jos sivusto koostuu yli 50 000 URL-osoitteesta, tai jos sivustokartan koko on yli 50 Mt, on luotava useita sivustokarttatiedostoja ja käytettävä sivustokarttahakemistotiedostoa. Sivustokarttahakemistotiedostoa on käytettävä myös silloin, kun sivusto on kooltaan pieni, mutta suunnitelmissa on nostaa URL-osoitteiden määrää yli 50 000:een tai kokoa yli 50 megatavuun. Sivustokarttahakemistotiedosto voi sisältää enintään 50 000 sivustokarttaa. Sen enimmäiskoko on 50 Mt (52 428 800 tavua). Voit pakata sivustokarttasi gzip-muodossa.

Q: Sivustossani on kymmeniä miljoonia URL-osoitteita; voinko kuitenkin lähettää vain äskettäin muuttamani URL-osoitteet?

Voit lisätä usein päivitettävät URL-osoitteet pieneen joukkoon sivustokarttoja ja määrittää sitten kyseiset sivustokarttatiedostot käyttämällä lastmod-koodia sivustokarttahakemistotiedostossa. Tämän jälkeen hakukoneet voivat indeksoida vain muuttuneet sivustokartat.

Q: Mitä teen sivustokartan luomisen jälkeen?

Kun olet luonut sivustokarttatiedoston, kerro siitä hakukoneille lähettämällä se suoraan niille, lähettämällä niille tiedustelupaketti tai lisäämällä sivustokarttasi sijainti robots.txt-tiedostoosi.

Q: Onko sivustokartan URL-osoitteet määritettävä tarkasti?

Kyllä. Protokolla (esimerkiksi http) on lisättävä URL-osoitteeseen. Lisää URL-osoitteen perään myös kauttaviiva, mikäli verkkopalvelin tätä edellyttää. Esimerkiksi osoite http://www.esimerkki.fi/ on sivustokarttaan kelpaava URL-osoite kun taas www.esimerkki.fi ei ole.

Q: Sivustoni URL-osoitteissa on http- ja https-versioita. Onko minun merkittävä molemmat?

Ei. Merkitse sivustokarttoihisi vain yksi URL-osoiteversio. Jos sisällytät useita URL-osoiteversioita, sivustoasi ei voida ehkä indeksoida kunnolla.

Q: Sivustoni URL-osoitteissa on istuntotunnukset. Onko minun poistettava ne?

Kyllä. Istuntotunnusten sisällyttäminen URL-osoitteisiin voi johtaa sivustosi vaillinaiseen ja turhaan indeksointiin.

Q: Vaikuttaako URL-osoitteen sijainti sivustokartassa sen käyttöön?

Ei. URL-osoitteen sijainti sivustokartassa ei todennäköisesti vaikuta siihen, miten hakukoneet käyttävät sitä tai ottavat sen huomioon.

Q: Jotkut sivustoni sivut käyttävät kehyksiä. Lisäänkö kehyssivujen URL-osoitteet vai kehysten sisältöjen URL-osoitteet?

Sisällytä molemmat URL-osoitteet.

Q: Voinko pakata sivustokarttani zip-muodossa vai onko ne pakattava gzip-muodossa?

Pakkaa sivustokarttasi gzip-muodossa. Muista, että sivustokarttasi ei saa pakattunakaan olla suurempi kuin 50 Mt (52 428 800 tavua).

Q: Muuttaako XML-sivustokartan painoarvoa (priority) koskeva vihje sivujeni sijoitusta hakutuloksissa?

Sivustokarttasi "priority"-vihje osoittaa vain tietyn URL-osoitteen merkityksen suhteessa muihin URL-osoitteisiin omassa sivustossasi, eikä vaikuta sivujesi sijoitukseen hakutuloksissa.

Q: Onko olemassa XML-kaavaa, jonka mukaan voin vahvistaa XML-sivustokarttani?

Kyllä. Sivustokarttatiedostojen XML-kaava on saatavissa osoitteessa http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd ja sivustokarttahakemistotiedostojen kaava on saatavissa osoitteessa http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd. Katso myös lisätietoja sivustokartan vahvistamisesta.

Q: Entä jos minulla on kysyttävää protokollan käytöstä tai sivustokartan lähettämisestä?

Katso lisätietoja sivustokarttojen lähettämisestä ja käytöstä kunkin hakukoneen dokumentaatiosta.

Sivun alkuun

Viimeisin päivitys: 21.11.2016