Vad krävs för att SiteSeeker ska kunna indexera ett dokument och göra det sökbart?

2012-04-25

Kunskapsdatabasen, Indexering

Följande krav måste respektive bör vara uppfyllda för att ett dokument ska kunna indexeras av SiteSeeker

Krav som måste vara uppfyllda:

- använd semantisk HTML!

  1. Servern som dokumentet finns på måste vara webbaktiverad, och dokumentet ska kunna hämtas via HTTP/HTTPS.
  2. Dokumentet måste ha en URL som är unik för dokumentet.
  3. Om dokumentet är en del av en webbplats, måste man via vanliga länkar kunna klicka sig fram till dokumentet, dvs:
    • JavaScript får inte användas för visning av eller som enda navigationsväg till dokumentet,
    • formulär får inte användas för visning av eller som enda navigationsväg till dokumentet, och
    • kakfiler (cookies) får inte krävas för visning av dokumentet (men får användas för inloggning).
  4. Dokumentet måste vara tillåtet för SiteSeeker att indexera enligt webbserverns robots.txt-fil.
  5. Dokumentet måste vara tillåtet för sökmotorer att indexera enligt eventuella robots-metataggar i detsamma.

Krav som bör vara uppfyllda

  1. Dokumentet ska ha en bra titel, angiven i title-elementet eller med metatagg.
  2. Text som inte ska indexeras såsom navigation, menyer och sidhuvud/sidfot i HTML ska vara försedda med särskilda markörer.
  3. Dokumentet ska använda semantisk och korrekt HTML.
  4. Varje unik webbsida eller dokument ska nås med endast en URL och den ska vara beständig över tiden.

Bonus

Dessa krav gäller både vanliga webbsidor och dokument, t.ex. PDF:er. När kraven är uppfyllda för alla sidor du vill ska vara sökbara kan SiteSeeker indexera dem och detsamma gäller för de globala sökmotorerna. Dessutom uppfylls fundamentala tillgänglighetskrav för besökare.