Vilka dokumenttyper kan SiteSeeker indexera?

2013-08-19

Allmän info

SiteSeeker kan indexera alla vanligt förekommande dokumenttyper:

  • Webbsidor (HTML, dynamiska eller statiska)
  • Textsidor (ren text utan formatering)
  • PDF-dokument
  • MS Office-dokument (Word, PowerPoint, Excel)
  • RTF-dokument (Rich Text Format)
  • Bilder (jpg, gif, etc.)

För samtliga dokumentformat med text gäller att all brödtext i dokumenten indexeras (fulltextindexering). I pdf-dokument indexeras de första 50 sidorna. Alla typer av metadata, som nyckelord och beskrivning, kan indexeras (inställningsbart i Admin). Dessutom kan SiteSeeker för samtliga dokumentformat hämta metadata som inte finns lagrad direkt i dokumenten, s.k. extern metadata.

SiteSeeker konverterar varje indexerat icke-HTML-dokument till HTML, och dessa HTML-versioner av dokumenten kan visas via en länk "cachad kopia" på resultatsidan.

Bilder visas i en separat träfflista, omskalade till lämplig storlek.