Vad är skillnaden mellan de olika sidhämtningslägena?

2012-07-16

Kunskapsdatabasen, Indexering

När du manuellt startar en indexering i SiteSeeker Admin kan du välja mellan tre olika sidhämtningslägen: full, minimal och ingen. Här beskrivs i detalj vad som skiljer de olika lägena så att du kan välja det läge som passar bäst.

Full indexering

I sidhämtningsläge full undersöker SiteSeeker alltid alla startpunkters URL:er och alla URL:er på webbplatsen som det finns länkar till.

För varje URL efterfrågar SiteSeeker sidan eller dokumentet från webbservern. SiteSeeker cachar alla sidor och dokument som hämtas, så för en sida som har hämtats tidigare kan webbservern instruera SiteSeeker att använda den cachade kopian. Detta gör efterföljande sidhämtningar betydligt snabbare, givet att webbservern stöder HTTP-funktionen if modified since.

Endast med sidhämtningsläge full kan du kan vara säker på att SiteSeeker hämtar alla nytillkomna och ändrade dokument och att borttagna dokument inte längre indexeras.

Sidhämtningsläget full är bra att använda i följande fall:

  • När du ändrat en mall som används av många sidor, t.ex. navigation
  • När du lagt till dokument som ska bli sökbara och som inte länkas till från någon av startpunkterna
  • När du ändrat ett dokument som inte är en startpunkt och du vill att SiteSeeker ska indexera det snarast

Minimal indexering

I sidhämtningsläge minimal hämtar SiteSeeker så få sidor som möjligt från webbservn. Dock undersöks alltid startpunkternas URL:er (länkdjup 0) och normalt även länkar i dem (länkdjup 1) och även URL:er som tidigare inte har kunnat hämtas (t.ex. döda länkar). Till vilket länkdjup som sidor undersöks framgår i rapporten Indexeringspremisser.

Sidhämtningsläget minimal är bra att använda i följande fall:

  • När du bara ändrat ett dokument som är en startpunkt
  • När du reparerat en trasig länk
  • Om du ändrat någon begränsning för sidhämtningen, t.ex. länkdjup och vill indexera fler eller färre dokument
  • Om du ändrat inställningar för tillåtna/förbjudna URL:er

Med sidhämtningsläge minimal kan du inte vara säker på att SiteSeeker hämtar alla nytillkomna och ändrade dokument.

Sammanfattningsvis gör SiteSeeker i regel betydligt färre HTTP-förfrågningar till webbservern än i sidhämtningsläge full. I vissa fall kan dock antalet förfrågningar fortfarande vara högt, t.ex. då det finns många döda länkar eller om sidhämtningsinställningarna har ändrats.

Tips: Om nytillkomna eller viktiga sidor finns länkade från några särskilda URL:er, kan du ange dessa URL:er som startpunkter och därigenom se till att de nya och viktiga sidorna hämtas vid detta sidhämtningsläge.

Ingen sidhämtning

I sidhämtningsläge ingen undersöker SiteSeeker inte någon URL på webbservern.

Sidhämtningsläget ingen är bra att använda i följande fall:

  • Om du infört en begränsning för sidhämtningen, t.ex. på länkdjup och vill indexera färre dokument
  • Om du utökat reglerna för förbjudna URL:er så de omfattar fler URL:er utöver tidigare förbjudna URL:er
  • Om du ändrat en inställning för gränssnittet där det står att en ändring kräver en indexering

I sidhämtningsläge ingen gör SiteSeeker dock en HTTP-förfrågan för filen robots.txt.

Automatiska indexeringar

SiteSeeker utför en indexering med automatik minst en gång per dygn, givet att ingen indexering redan pågår. Under denna indexering är sidhämtningsläget i allmänhet full.

Det finns möjlighet att utföra indexeringar oftare än en gång per dygn. Kontakta Euroling Support om du behöver hjälp med att ändra indexeringsintervall.

Notera slutligen att de sidhämtningslägen man kan ange vid en manuellt startad indexering inte gäller för automatiska indexeringar.

Har du behov av att nytillkomna sidor snabbt blir sökbara? Läs gärna mer om notifierad indexering och hur man kan få SiteSeeker att uppdatera indexet direkt då innehållet på webbplatsen ändras.