Vad krävs för att SiteSeeker ska kunna indexera ett dokument och göra det sökbart?
2012-04-25Följande krav måste respektive bör vara uppfyllda för att ett dokument ska kunna indexeras av SiteSeeker
Krav som måste vara uppfyllda:
- använd semantisk HTML!
- Servern som dokumentet finns på måste vara webbaktiverad, och dokumentet ska kunna hämtas via HTTP/HTTPS.
- Dokumentet måste ha en URL som är unik för dokumentet.
- Om dokumentet är en del av en webbplats, måste man via vanliga länkar kunna klicka sig fram till dokumentet, dvs:
- JavaScript får inte användas för visning av eller som enda navigationsväg till dokumentet,
- formulär får inte användas för visning av eller som enda navigationsväg till dokumentet, och
- kakfiler (cookies) får inte krävas för visning av dokumentet (men får användas för inloggning).
- Dokumentet måste vara tillåtet för SiteSeeker att indexera enligt webbserverns robots.txt-fil.
- Dokumentet måste vara tillåtet för sökmotorer att indexera enligt eventuella robots-metataggar i detsamma.
Krav som bör vara uppfyllda
- Dokumentet ska ha en bra titel, angiven i title-elementet eller med metatagg.
- Text som inte ska indexeras såsom navigation, menyer och sidhuvud/sidfot i HTML ska vara försedda med särskilda markörer.
- Dokumentet ska använda semantisk och korrekt HTML.
- Varje unik webbsida eller dokument ska nås med endast en URL och den ska vara beständig över tiden.
Bonus
Dessa krav gäller både vanliga webbsidor och dokument, t.ex. PDF:er. När kraven är uppfyllda för alla sidor du vill ska vara sökbara kan SiteSeeker indexera dem och detsamma gäller för de globala sökmotorerna. Dessutom uppfylls fundamentala tillgänglighetskrav för besökare.