Gå direkt till sidans huvudinnehåll

Har din webbplats en sitemap.xml?

Det finns webbstandard, defacto-standard och så finns det konventioner. Alla är namn på mer eller mindre samma sak. Följer man dessa konventioner gör man det lättare och mer förutsägbart för alla aktörer på webben att samarbeta.

Jag skulle påstå att detta har särskilt de mindre etablerade aktörerna stor nytta av än giganter som Apple, Google, Microsoft, Amazon, med flera.

Här följer en genomgång över vad jag anser borde ingå i nationell webbstandard, alltså webbriktlinjer.se, och en genomlysning hur några hundra inom offentlig sektor gjort kring sitemaps.

Vad ska jag ha en sitemap.xml till?

”Sitemaps are an easy way for webmasters to inform search engines about pages on their sites that are available for crawling. In its simplest form, a Sitemap is an XML file that lists URLs for a site along with additional metadata about each URL (when it was last updated, how often it usually changes, and how important it is, relative to other URLs in the site) so that search engines can more intelligently crawl the site.”
Sitemaps.org

Man skulle kunna tro att detta handlar om sökmotorer, men så är inte fallet, åtminstone inte enbart. Så som jag skrev i min bok om webbanalys förra året:

”En sitemap är en teknisk motsvarighet till webbplatskartan. Alltså en lista med alla sidor som finns på en webbplats. Sitemaps är en industristandard som togs fram av sökmotorföretag som Google, Bing med flera, men du kan mycket väl använda din sitemap till andra grejer än att skicka till sökmotorerna.

Bland annat kan din egen sökmotor ha nytta av den. Eller de som du samarbetar med kanske vill kunna bevaka när det kommer nytt material på din webbplats. Sitemapens innehåll är en kronologisk lista över vilka adresser som finns på webbplatsen. Nyast överst och dessutom kan man lägga in en viktning om adressens relativa värde inom webbplatsen.

Sitemapen ska gärna heta något förutsägbart, som sitemap.xml, och placeras i webbplatsens hemkatalog. Alternativt talar du om i din robots.txt var man kan hitta sitemapen. Har du flera sitemaps behöver du en så kallad siteindex, det är en lista över vilka sitemaps du har. Detta kan behövas om man har oerhört många poster i sina sitemaps, man får nämligen inte har en oändligt stor sitemap.”
– Webbanalys - förstå och förbättra användarnas upplevelse (2016)

En sitemap är alltså en öppen innehållsförteckning över din webbplats. Det kan du dra nytta av inom sökmotoroptimering genom att tipsa Google och Bing i deras Search Console och Webmaster Tools om var din(a) sitemaps finns. Det förenklar för dem att upptäcka nyskapat och förändrat material på din webbplats.

Alternativet till att få denna sammanställning är att kolla runt på din webbplats i (en kanske fruktlös) jakt på att hitta något som är nytt sedan botten kollade senast. Det är inte så effektivt, därför uppmuntras man att tala om var en sitemap finns att hämta.

Att detta är en utmaning märker jag själv, bland annat när jag försöker jämföra hur bra svensk offentlig sektor är inom webbprestanda. För de webbplatser som har en sitemap.xml kan jag välja att basera mitt test på de 50 senast skapade sidorna, men det hela blir lite skevt då majoriteten av webbplatserna inte följer denna (defacto)standard då jag oftast tvingas hämta 50 adresser från webbplatsens startsida istället.

Vad ska min sitemap heta och var lägger jag den?

För att inte missgynna små aktörer är det en god idé att följa konventionen om namngivning och placering av din sitemap. Jag är osäker på om Wordpress var först på detta, men då Wordpress sedan ett tag tillbaka driver cirka 30% av alla webbplatser är deras lösningar att betrakta som defacto-standard för alla webbplatser.

Wordpress lägger sitemaps i roten på webbplatsen och kallar dem för sitemap.xml, med andra ord, om du följer detta ska du likt jag få din sitemap tillgänglig via roten på domänen. I mitt fall är det webperf.se/sitemap.xml som serverar ett flertal sitemaps beroende på vad innehållet är av för sort.

Apropå små aktörer så blir det mycket extrajobb om de ska behöva leta runt efter din eventuella sitemap. Första steget är att kolla om du har en sitemap.xml i roten på din webbplats, finns inte den får man börja leta efter en robots.txt som kanske anger var sitemapens finns, innan man kanske ger upp. Om du tänker ”long tail” kring att nå ut med ditt innehåll kan detta löna sig även kortsiktigt.

Behöver du ha flera olika sitemaps kan du skapa en sitemap för de olika sitemaps du har, en sådan kallas för ett siteindex. Det kan handla om att man vill skilja på olika sorters innehåll. Som att man har en sitemap för bilder, en för videoklipp, en för bloggposter, en för produkter och så vidare.

Så, hur har då svensk offentlig sektor gjort?

Jag tog en titt på hur svensk offentlig sektor gjort just detta. Jag har anropat sitemap.xml under respektive unik domän eller geografisk myndighets webbplats.

Här drar jag stora växlar på webbstandard och kommunallagens krav om att undvika ”otillbörligt gynnande av enskild”, vilket jag tänker gynnar de stora aktörerna om man inte följer namnstandard och enbart berättar för Google var ens sitemap finns. Även fast det med största sannolikhet inte är ett lagbrott är ambitionen från samhället tydlig, samhällsaktörer ska försöka vara öppna gentemot alla, inte bara vissa.

Det finns tre sorter av webbplatser i nedan tabell. Jag har försökt förenkla genom att använda olika emoticons:

  • De som får tummen ner är de som anger att de inte har en sitemap.xml i roten på sin webbplats.
  • De som får tummen upp är de som både säger att de har en sitemap.xml men också skickar en fil som faktiskt ser ut som en sitemap.
  • Sen finns det de som säger att de har en sitemap men som inte validerar, de får en ilsken emoticon då de inte alls tycks ha koll på sin webbteknik och slösar med bottarnas energi. Ofta beror detta på att de inte skickar korrekt statuskod, de som inte har en sitemap ska skicka statuskod 404 snarare än 200 och låtsas att allt är i sin ordning.
Webbplats Statuskod Validerar
arbetsformedlingen.se 520 ?
arvidsjaur.se 404 ?
berg.se 404 ?
bolagsverket.se 404 ?
bollebygd.se 404 ?
botkyrka.se 404 ?
boverket.se 404 ?
bastad.se 403 ?
csn.se 404 ?
degerfors.se 404 ?
dorotea.se 404 ?
eskilstuna.se 200 ?
falkenberg.se 200 ?
falkoping.se 404 ?
falun.se 200 ?
forshaga.se 404 ?
gnesta.se 404 ?
grums.se 404 ?
gullspang.se 200 ?
gavle.se 200 ?
gotene.se 200 ?
halmstad.se 200 ?
haparanda.se 404 ?
havochvatten.se 200 ?
heby.se 404 ?
helsingborg.se 200 ?
huddinge.se 404 ?
hultsfred.se 200 ?
hylte.se 404 ?
habo.se 404 ?
hellefors.se 404 ?
harnosand.se 200 ?
hig.se 200 ?
sofi.se 404 ?
kalix.se 404 ?
karlshamn.se 200 ?
karlskoga.se 404 ?
karlskrona.se 404 ?
karlstad.se 404 ?
kinda.se 404 ?
konstfack.se 404 ?
kramfors.se 404 ?
krokom.se 404 ?
kb.se 404 ?
ltkronoberg.se 404 ?
lantmateriet.se 404 ?
lekeberg.se 404 ?
lerum.se 200 ?
lidingo.se 200 ?
lidkoping.se 200 ?
lindesberg.se 404 ?
linkoping.se 200 ?
ljungby.se 404 ?
lulea.se 200 ?
lund.se 404 ?
lansstyrelsen.se/blekinge/ 404 ?
w.lst.se 404 ?
lansstyrelsen.se/gavleborg/ 404 ?
lansstyrelsen.se/jamtland/ 404 ?
lansstyrelsen.se/jonkoping/ 404 ?
lansstyrelsen.se/kalmar/ 404 ?
lansstyrelsen.se/kronoberg/ 404 ?
ab.lst.se 404 ?
d.lst.se 404 ?
lansstyrelsen.se/varmland/ 404 ?
ac.lst.se 404 ?
y.lst.se 404 ?
lansstyrelsen.se/vastragotaland/ 200 ?
lansstyrelsen.se/orebro/ 404 ?
mariestad.se 200 ?
migrationsverket.se 404 ?
msb.se 404 ?
molndal.se 404 ?
nacka.se 404 ?
naturvardsverket.se 404 ?
norrkoping.se 200 ?
olofstrom.se 200 ?
orust.se 200 ?
oxelosund.se 200 ?
pensionsmyndigheten.se 404 ?
pitea.se 200 ?
pts.se 404 ?
ragunda.se 404 ?
gotland.se 404 ?
skane.se 404 ?
raa.se 200 ?
riksdagen.se 200 ?
sala.se 200 ?
salem.se 200 ?
sandviken.se 200 ?
sida.se 404 ?
simrishamn.se 404 ?
sjobo.se 404 ?
skatteverket.se 404 ?
skelleftea.se 404 ?
skinnskatteberg.se 404 ?
skovde.se 404 ?
socialstyrelsen.se 404 ?
sollentuna.se 404 ?
scb.se 404 ?
stockholm.se 200 ?
stralsakerhetsmyndigheten.se 200 ?
strangnas.se 404 ?
stromsund.se 404 ?
swedac.se 200 ?
sundbyberg.se 404 ?
sundsvall.se 404 ?
sunne.se 200 ?
sgu.se 404 ?
smhi.se 404 ?
soderhamn.se 404 ?
soderkoping.se 404 ?
sodertalje.se 200 ?
solvesborg.se 404 ?
tanum.se 404 ?
tidaholm.se 404 ?
tierp.se 404 ?
timra.se 404 ?
tjorn.se 404 ?
tomelilla.se 200 ?
torsby.se 200 ?
trafikverket.se 404 ?
transportstyrelsen.se 404 ?
tranas.se 200 ?
trollhattan.se 200 ?
toreboda.se 200 ?
uddevalla.se 200 ?
umea.se 404 ?
upplandsvasby.se 404 ?
upplands-bro.se 200 ?
uppsala.se 404 ?
vara.se 404 ?
varberg.se 200 ?
vinnova.se 404 ?
vetlanda.se 200 ?
vimmerby.se 404 ?
vindeln.se 404 ?
vargarda.se 200 ?
varmdo.se 200 ?
vastervik.se 200 ?
vasteras.se 404 ?
vgregion.se 200 ?
ystad.se 404 ?
ange.se 404 ?
asele.se 404 ?
alvkarleby.se 404 ?
engelholm.se 404 ?
orebro.se 200 ?
ostersund.se 404 ?
ale.se 200 ?
alingsas.se 404 ?
alingsastingsratt.domstol.se 404 ?
kammarkollegiet.se/rattsavdelningen/alkoholsortimentsnamnden/ 404 ?
arn.se 404 ?
alvesta.se 200 ?
ap2.se 404 ?
aneby.se 404 ?
arbetsdomstolen.se 404 ?
arbetsgivarverket.se 200 ?
av.se 200 ?
arboga.se 200 ?
arjeplog.se 404 ?
arvsfonden.se 200 ?
arvika.se 404 ?
askersund.se 404 ?
attundatingsratt.domstol.se 404 ?
avesta.se 404 ?
bo.se 404 ?
bengtsfors.se 404 ?
bjurholm.se 404 ?
bjuv.se 404 ?
bth.se 404 ?
blekingetingsratt.domstol.se 404 ?
boden.se 404 ?
bfn.se 404 ?
bollnas.se 404 ?
borgholm.se 200 ?
borlange.se 404 ?
boras.se 200 ?
borastingsratt.domstol.se 404 ?
boxholm.se 404 ?
bromolla.se 404 ?
bra.se 404 ?
brottsoffermyndigheten.se 404 ?
bracke.se 404 ?
burlov.se 404 ?
epn.se 200 ?
dalsed.se 404 ?
danderyd.se 200 ?
datainspektionen.se 200 ?
do.se 200 ?
domstol.se/Om-Sveriges-Domstolar/Domarnamnden/ 404 ?
domstol.se 404 ?
ehalsomyndigheten.se 200 ?
elegnamnden.se 404 ?
eda.se 404 ?
ekero.se 404 ?
ekobrottsmyndigheten.se 404 ?
esv.se 200 ?
eksjo.se 404 ?
eksjotingsratt.domstol.se 404 ?
elsakerhetsverket.se 404 ?
emmaboda.se 200 ?
energimarknadsinspektionen.se 404 ?
enkoping.se 404 ?
ersattningsnamnden.se 520 ?
eskilstunatingsratt.domstol.se 404 ?
eslov.se 404 ?
essunga.se 404 ?
ekn.se 404 ?
fagersta.se 404 ?
falutingsratt.domstol.se 404 ?
fmi.se 200 ?
kammarkollegiet.se/rattsavdelningen/fideikommissnamnden/ 404 ?
filipstad.se 404 ?
fi.se 404 ?
finanspolitiskaradet.se 200 ?
finspang.se 200 ?
ap4.se 200 ?
flen.se 404 ?
folkebernadotteacademy.se 200 ?
folkhalsomyndigheten.se 404 ?
forskarskattenamnden.se 404 ?
formas.se 404 ?
fas.se 200 ?
fortv.se 404 ?
levandehistoria.se 404 ?
fargelanda.se 200 ?
ap1.se 404 ?
fmv.se 200 ?
fra.se 404 ?
fxm.se 404 ?
fhs.se 404 ?
forsvarsmakten.se 200 ?
undom.se 404 ?
forsakringskassan.se 404 ?
lansrattenigoteborg.domstol.se 200 ?
lansrattenivasternorrland.domstol.se 200 ?
lansrattenijonkoping.domstol.se 200 ?
lansrattenivarmland.domstol.se 200 ?
forvaltningsrattenilinkoping.domstol.se 404 ?
lansratteninorrbotten.domstol.se 200 ?
lansratteniskane.domstol.se 200 ?
lansrattenistockholm.domstol.se 200 ?
forvaltningsratteniumea.domstol.se 404 ?
lansratteniuppsala.domstol.se 200 ?
forvaltningsrattenivaxjo.domstol.se 404 ?
gagnef.se 404 ?
genteknik.se 404 ?
gislaved.se 404 ?
gnosjo.se 404 ?
gotlandstingsratt.domstol.se 404 ?
grastorp.se 200 ?
gih.se 404 ?
gellivare.se 404 ?
gavletingsratt.domstol.se 404 ?
gotahovratt.se 404 ?
goteborg.se 200 ?
goteborgstingsratt.domstol.se 404 ?
gu.se 404 ?
habokommun.se 404 ?
hagfors.se 404 ?
hallsberg.se 200 ?
hallstahammar.se 404 ?
halmstadstingsratt.domstol.se 404 ?
hammaro.se 404 ?
haninge.se 404 ?
harpsund.se 200 ?
hedemora.se 404 ?
helsingborgstingsratt.domstol.se 404 ?
herrljunga.se 200 ?
hjo.se 200 ?
hofors.se 404 ?
hovrattenfornedrenorrland.se 404 ?
hovrattenskaneblekinge.domstol.se 404 ?
vastrahovratten.domstol.se 404 ?
hovrattenovrenorrland.domstol.se 404 ?
hudiksvall.se 404 ?
hudiksvallstingsratt.domstol.se 404 ?
hyresnamnden.se 404 ?
hsan.se 200 ?
herjedalen.se 404 ?
harryda.se 404 ?
hassleholm.se 404 ?
hassleholmstingsratt.domstol.se 404 ?
hoganas.se 404 ?
hogsby.se 404 ?
du.se 200 ?
hb.se 200 ?
hh.se 200 ?
his.se 200 ?
hkr.se 200 ?
hv.se 200 ?
hogstadomstolen.se 404 ?
regeringsratten.se 404 ?
horby.se 404 ?
hoor.se 200 ?
ilo.org/ 404 ?
iaf.se 404 ?
inspsf.se 404 ?
isp.se 200 ?
ivo.se 404 ?
ifau.se 404 ?
irf.se 404 ?
programkontoret.se 520 ?
jokkmokk.se 404 ?
justitiekanslern.se 200 ?
jll.se 404 ?
jarfalla.se 200 ?
jonkoping.se 200 ?
jonkopingstingsratt.domstol.se 404 ?
kalmar.se 404 ?
kalmartingsratt.domstol.se 404 ?
kammarkollegiet.se 404 ?
kammarratten.goteborg.se 404 ?
kammarrattenijonkoping.domstol.se 404 ?
kammarrattenistockholm.domstol.se 404 ?
kammarrattenisundsvall.se 404 ?
karlsborg.se 200 ?
kau.se 404 ?
ki.se 200 ?
katrineholm.se 200 ?
kemi.se 520 ?
kil.se 200 ?
kommun.kiruna.se 404 ?
klippan.se 404 ?
knivsta.se 404 ?
kommers.se 200 ?
konj.se 200 ?
konkurrensverket.se 404 ?
konstnarsnamnden.se 404 ?
konsumentverket.se 200 ?
kriminalvarden.se 404 ?
kristianstad.se 404 ?
kristianstadstingsratt.domstol.se 404 ?
kristinehamn.se 200 ?
kronofogden.se 404 ?
kumla.se 200 ?
kkh.se 404 ?
kmh.se 404 ?
kth.se 404 ?
kungsbacka.se 404 ?
kungsor.se 200 ?
kungalv.se 200 ?
kustbevakningen.se 404 ?
karnavfallsfonden.se 404 ?
kavlinge.se 404 ?
koping.se 404 ?
lagradet.se 404 ?
laholm.se 404 ?
landskrona.se 404 ?
ltblekinge.se 404 ?
ltdalarna.se 404 ?
lg.se 200 ?
lj.se 404 ?
ltkalmar.se 404 ?
lul.se 404 ?
liv.se 200 ?
lio.se 404 ?
landstingetsormland.se 404 ?
lvn.se 200 ?
ltv.se 404 ?
laxa.se 200 ?
leksand.se 404 ?
lessebo.se 404 ?
lillaedet.se 404 ?
linkopingstingsratt.domstol.se 404 ?
liu.se 404 ?
linneuniversitetet.se 520 ?
lsh.se 404 ?
slv.se 200 ?
ljusdal.se 404 ?
ljusnarsberg.se 404 ?
lomma.se 404 ?
lotteriinspektionen.se 520 ?
ludvika.se 404 ?
lfv.se 200 ?
ltu.se 404 ?
lundstingsratt.domstol.se 404 ?
lu.se 200 ?
lycksele.se 404 ?
lyckseletingsratt.domstol.se 404 ?
lysekil.se 200 ?
lakemedelsverket.se 404 ?
lansstyrelsen.se/gotland/ 404 ?
lansstyrelsen.se/halland/ 404 ?
bd.lst.se 404 ?
lansstyrelsen.se/skane/ 404 ?
lansstyrelsen.se/uppsala/ 404 ?
lansstyrelsen.se/vastmanland/ 404 ?
lansstyrelsen.se/ostergotland/ 404 ?
mah.se 404 ?
malmo.se 200 ?
malmotingsratt.domstol.se 404 ?
malung-salen.se 404 ?
mala.se 404 ?
markaryd.se 200 ?
marknadsdomstolen.se 404 ?
mark.se 404 ?
mi.se 404 ?
mellerud.se 404 ?
miun.se 404 ?
mjolby.se 404 ?
modernamuseet.se 404 ?
mora.se 404 ?
moratingsratt.domstol.se 404 ?
motala.se 403 ?
mullsjo.se 404 ?
munkedal.se 404 ?
munkfors.se 200 ?
mfd.se 404 ?
mia.eu/ 404 ?
kulturanalys.se 404 ?
radioochtv.se 404 ?
mtm.se 404 ?
tillvaxtanalys.se 200 ?
vardanalys.se 200 ?
yhmyndigheten.se 520 ?
mdh.se 404 ?
monsteras.se 200 ?
morbylanga.se 404 ?
nackatingsratt.domstol.se 404 ?
nationalmuseum.se 404 ?
nrm.se 404 ?
nora.se 404 ?
norberg.se 404 ?
nordanstig.se 200 ?
nai.uu.se 200 ?
nordmaling.se 404 ?
nll.se 404 ?
norrkopingstingsratt.domstol.se 404 ?
norrtalje.se 200 ?
norrtaljetingsratt.domstol.se 404 ?
norsjo.se 404 ?
domstol.se/templates/DV_InfoPage.aspx?id=3805/ 404 ?
nybro.se 404 ?
nykvarn.se 404 ?
nykoping.se 200 ?
nykopingstingsratt.domstol.se 404 ?
nynashamn.se 200 ?
nfh.se 404 ?
sst.a.se 404 ?
namndenmotdiskriminering.se 200 ?
nassjo.se 404 ?
ockelbo.se 404 ?
orsa.se 200 ?
osby.se 404 ?
oskarshamn.se 404 ?
ovanaker.se 404 ?
pajala.se 404 ?
pbr.se 404 ?
partille.se 404 ?
prv.se 404