Strukturerad sökning

2011-11-10

Söksidan, EPiServer

Strukturerad information kan enkelt kombineras med fritextsökfrågor, vilket är idealiskt i många sammanhang, t.ex. e-handelsplatser, kurskataloger eller personalkataloger.

  • Användningsmönster

Många typer av information är i grunden ostrukturerad, t.ex. dokument i ett filarkiv eller webbsidor. I vissa fall finns det dock strukturerad information, och genom att göra den sökbar kan man erbjuda användaren möjligheten att filtrera och sortera sökresultat på ett kraftfullt sätt, samtidigt som man möjliggör olika typer av dynamiska listningar.

Användarbehov

  • Som användare vill jag sortera träffarna efter pris, datum, storlek eller popularitet.
  • Som användare vill jag kunna filtrera träffarna på kategori, färg, fabrikat eller storlek.
  • Som redaktör vill jag kunna skapa en listning som visar träffar som innehåller samma taggar som aktuell sida.
  • Som redaktör vill jag kunna se vilka sidor jag är ansvarig för.

Lösningar

Grunden för de flesta söktillämpningar är möjligheten att kunna fritextsöka på alla attribut, även strukturerade sådana. I nedanstående exempel får man samma träffar på kurser om man söker på "gitarr stockholm":

Fritextsökning på "gitarr stockholm"

…som man får när man söker på "gitarr" och väljer kategorin "Stockholm":

Fritextsökning på "gitarr" inom kategorin Stockholm

I ovanstående exempel kan man välja bland ett antal facetter, dels i formuläret ovanför sökresultaten, dels i översikten till höger och som flikar. Den mest tillgängliga formen av facetterad sökning är i allmänhet att visa den i en översikt eller som flikar; alternativ i ett formulär har i regel mindre bra användbarhet. Läs mer om facetterad sökning.

I exemplet ovan används också strukturerad data för sortering. Om man som användare klickar på någon av rubrikerna sorteras resultatet om. I följande bild har användaren klickat på kolumnen "Pris" (jämför med närmast föregående bild):

Sorterat på pris

På strukturerade attribut kan man kan söka nycklat, dvs. att man anger vilket attribut man önskar söka på. Exempelvis kan man söka på sidor skapade av en viss författare:

Sökning på attribut

Vid sidan av möjligheterna att filtrera och sortera på strukturerad data är det för många typer av strukturerad data också önskvärt och möjligt att visa upp den, för respektive träff, på själva söksidan eller i en dynamisk listning. Alla träffar som SiteSeeker ger har vissa grundegenskaper, såsom en URL, en titel, och ett textutdrag. Vid sidan av dessa finns ytterligare egenskaper, som datum, storlek, beskrivning och kategorier.

Utöver dessa är det också möjligt att visa flera typer av strukturerade attribut. Detta är användbart om man t.ex. önskar visa en viss egenskap indexerade objekt har. I på en e-handelsplats kan man t.ex. skriva ut produktens pris, och för att skapa en köpknapp direkt i träfflistan behöver man ofta ett produkt-id. Dessa båda egenskaper kan indexeras som strukturerade attribut, och visas i söksidan:

Produktsökning

Ett specialfall av detta användningsområde är att indexera en URL till en tumnagelsbild som representerar en viss produkt eller sida, som i bilden ovan. (För detta användningsfall kan det finnas andra metoder som också är användbara, t.ex. att utnyttja SiteSeekers stöd för s.k. teaser-bilder.)

Hur strukturerad data indexeras

Detta är en kort översikt av indexering och strukturerad data – mer information finns under teknik-fliken.

För varje objekt som SiteSeeker indexerar lagras en mängd olika strukturerade attribut, såsom titel, datum, kategori etc. Utöver dessa kan du som SiteSeeker-administratör lägga till godtyckliga strukturerade attribut, som sedan går att använda för sortering och filtrering. Dessa attribut läggs till i SiteSeeker Admin för respektive webbserver som indexeras.

SiteSeeker Admin

SiteSeeker indexerar strukturerad data via <meta>-element i webbsidor, eller via s.k. extern metainformation för filer. Strukturerad data kan inte indexeras via microformat, dvs. data hämtad ur innehållet i webbsidor. Då sökningen utförs görs filtrering och sortering på strukturerade attribut genom speciella operatorer i sökfrågan. För vissa av SiteSeekers inbyggda strukturerade attribut, som kategorier (för facetterad sökning) eller datum kan man dessutom utföra filtrering och sortering via därför avsedda egenskaper i .NET- eller webbtjänst-API:erna.

Begränsningar och utmaningar

När man indexerar strukturerad data är det viktigt att på ett tidigt stadium bestämma sig för vilken information som ska vara möjlig att fritextsöka på, liksom vilka attribut som ska vara möjliga att visa i en facetterad sökning kontra attribut som ska användas för andra typer av filtrering.

Det finns ingen metod för att från SiteSeeker hämta ut tillgängliga värden för ett visst attribut – detta innebär att om man önskar lista möjliga värden krävs att man använder kategorier.

Vid sökning på strukturerade egenskaper är det extra viktigt att se till att användarupplevelsen på söksidan blir bra – detta eftersom strukturerade attribut inte erbjuder samma möjlighet till t.ex. uppmarkering av söktermerna. Avancerade formulär bör i möjligaste mån undvikas.