Hur indexerar jag lösenordsskyddade webbsidor?

2011-05-16

Kunskapsdatabasen, Indexering

SiteSeeker kan indexera lösenordsskyddade webbsidor med hjälp av HTTP-inloggning eller inloggning via formulär.

Inloggning och sidhämtning kan ske öppet eller SSL-krypterat (https) oavsett om man använder HTTP-inloggning eller formulärinloggning.

HTTP-autentiseringsmetoder som hanteras är s.k. "basic authentication", NTLM-autentisering (för t.ex. Windows) och digest-autentisering, och det går även att ange en Windows-domän.

För varje server kan du i SiteSeeker Admin under Hämtningsinställningar i inställningarna för servern ange vilket användarnamn och lösenord som gäller för skyddade sidor på servern.

För inloggning via formulär anger du dessutom vilken sida inloggningsformuläret finns på, liksom namnen på de formulärfält som används för användarnamn respektive lösenord (standardnamnen är username respektive password).

OBS: Tänk på att indexerade lösenordsskyddade sidor kan ses i sin helhet vid sökning. Du behöver själv se till att rätt person ser rätt träffar.

Felsökningstips

Följande fel är bland de vanligare när inloggningsskyddade sidor som borde indexeras inte gör det (typiskt med HTTP-svarskod 401 från webbservern):

Fel Åtgärd
Nödvändiga inställningar i brandvägg eller webbserver kopplade till SiteSeeker-serverns IP-adress saknas eller har försvunnit Kontrollera att nödvändiga inställningar är gjorda och fortfarande gäller. Har någon större förändring i datormiljön gjorts på sistone?
Kontot som SiteSeeker använder har ändrats Kontrollera att du manuellt kan logga in med samma uppgifter som är angivna i SiteSeeker Admin
Inloggningsmetoden är ändrad Kontrollera att SiteSeeker är instruerad att använda rätt metod i inställningarna för servern i Admin
Inloggning fungerar endast med JavaScript aktiverat Kontrollera att du manuellt kan logga in med JavaScript avslaget i din webbläsare
Webbservern tillämpar webbläsarsniffning och tillåter endast (vissa) webbläsare att logga in Kontrollera att du manuellt kan logga in med olika webbläsare och verktyg för överföring
URL:er till utloggning hämtas under sidhämtningen av SiteSeeker som loggas ut Kontrollera om någon undersökt URL matchar t.ex. logout med URL-inspektören i Admin. Om detta är fallet, undanta sådana URL:er från indexering
DoS-skydd (Denial of Service) förbjuder eller fördröjer förfrågningar i snabb följd Kontrollera rapporter och loggar från befintliga skydd