Status-Codes
Inhaltsübersicht:
Fehlerabfrage durch Status-Codes
Eine Website sollte lebendig sein und sich ständig weiterentwickeln. Vorsicht ist jedoch dabei geboten, eine neue Website-Struktur umzusetzen, Verzeichnis- und Dateinamen zu verändern oder Dateien einfach zu löschen. Oftmals werden die Inhalte auf neue Webseiten verteilt - zuungunsten der Suchmaschinen und vor allem der Nutzer, die nun auf einer Fehlerseite landen, wenn sie über die Ergebnislisten der Suchmaschinen kommen.
Individualisierte Fehlerseiten können auf
solche Gegebenheiten hinweisen und den Nutzer zu den
gewünschten Inhalten führen. Suchmaschinen müssen in
diesem Fall noch feinfühliger behandelt werden und über
sog.
Redirects
(dt. Umadressierungen) zur neuen
Datei geleitet werden. Beide Angaben erfolgen in der
.htaccess
-Datei, einer Textdatei, die im
Root-Verzeichnis
der Domain
abgelegt wird. Sie funktioniert jedoch nur, wenn der Server
ein Apache-Webserver ist!
Über die .htaccess
können verschiedene
Status-Codes abgefragt und behandelt werden:
Status-Codes | Bedeutung | Beschreibung |
---|---|---|
200 | OK | Das Dokument kann unter einem bestimmten URL erreicht und vom Webcrawler verarbeitet werden. |
301 | Moved Permanently | Das Dokument kann auf Dauer unter einem anderen URL erreicht oder gelöscht werden. |
302 | Moved Temporarily | Das Dokument kann temporär unter einem anderen URL erreicht oder gelöscht werden. |
304 | Not Modified | Das Dokument wurde seit der letzten Abfrage nicht verändert. |
401 | Unauthorized | Das Dokument unterliegt einer Autorisierung und kann daher nicht in den Datenbestand aufgenommen werden. |
404 | Not Found | Das Dokument ist nicht mehr erreichbar und kann gelöscht werden. |
500 | Internal Server Error | Das Dokument muss in eine Warteschlange aufgenommen werden, da es temporär, z.B. wegen Server-Überlastung, nicht abgerufen werden kann. |
Einen entsprechenden Ausschnitt einer .htaccess
-Datei
zeigt das nachfolgende Beispiel:
Beispiel einer .htaccess
-Datei (Ausschnitt):
<!-- Permanente Umleitung -->
redirect 301 /alter_ordner/alte_datei.html http://www.domainname.de/neue_datei.html
<!-- Temporäre Umleitung -->
redirect 302 /ordner/datei.html http://www.domainname.de/ordner/temp_datei.html
<!-- Fehlerseite bei geschützter Datei -->
ErrorDocument 401 /code401.html
<!-- Fehlerseite bei nicht vorhandener Datei -->
ErrorDocument 404 /code404.html
Individualisierte Fehlerseite
Die am Häufigsten auftauchende Fehlermeldung ist der Status Code 404 - Seite nicht gefunden. Auch hier ist Benutzerfreundlichkeit angebracht. Eine individualisierte Fehlerseite gehört zu jeder professionellen Website. Nutzer, die auf einer Fehlerseite landen, sind auf Hilfe angewiesen, bspw. durch Verweise auf die Homepage oder die Sitemap.
Eine Gestaltungsmöglichkeit einer solchen Fehlerseite zeigt das nachfolgende Beispiel:
Beispiel einer individualisierten Fehlerseite für Status-Code 404 (Ausschnitt):
[...]
<body>
<!-- Überschrift -->
<h1>Seite nicht gefunden (Fehler 404)</h1>
<!-- 'Persönliche' Begrüßung, mögliche Gründe -->
<p>Leider gibt es die von Ihnen angeforderte Seite nicht.
Vielleicht ist die Adresse der Seite nicht richtig geschrieben
oder eine Suchmaschine hat Sie zu einer veralteten Seite geschickt.</p>
<!-- Alternativen, Vorschläge -->
<p>Versuchen Sie Folgendes:</p>
<ul>
<li><a href="sitemap.html">zur Sitemap</a></li>
<li><a href="index.html">zur Startseite</a></li>
</ul>
<!-- Möglichkeit zur Kontaktaufnahme -->
<p>Falls Sie dennoch Probleme haben sollten, schreiben Sie uns:
<a href="mailto:support@itib.de">support@itib.de</a>!</p>
</body>
</html>
Zugriffsbeschränkung
Es gibt jedoch auch Dateien, die - temporär (noch nicht
fertig gestellte Webseiten)
oder konstant (Verzeichnisse mit Skript-Dateien) - vor Suchmaschinen
verborgen bleiben sollen. Um eine Indizierung
dieser bewusst zu verhindern, kann eine Datei, die
robots.txt
, im Root-Verzeichnis
angelegt werden (siehe nachfolgendes Beispiel). Mit der
User-agent
-Angabe
können Suchmaschinen namentlich Einzelanweisungen erhalten, im
nachfolgenden Beispiel gelten die Angaben für jegliche Suchmaschinen
und deren Webcrawler. Die
Disallow
-Angabe
schließt die angegebenen Verzeichnisse und Dokumente explizit
von der Indizierung aus.
Diese Datei sollte generell angelegt werden, da Webcrawler diese Datei verlangen und bei Nicht-Vorhandensein unbeantwortete Anfragen in den Logfiles des Webserver erzeugen. Wenn keine Restriktionen festgelegt werden brauchen, ist einfach eine leere Datei abzuspeichern. Dateien, die mit einem Passwortschutz belegt sind, werden von vornherein bei der Indizierung ausgeschlossen.
Beispiel einer Robots-Datei:
User-agent: *
Disallow: /scripts/
Disallow: /relaunch/
Disallow: /betriebsausflug/weihnachten2006.html
Weiterführende Literatur:
- Erlhofer, Sebastian:
- Suchmaschinen-Optimierung,
Seite 249 ff. sowie Seite 255,
Galileo Computing, Bonn, 1. Auflage 2005 (Galileo Press),
ISBN 3898426203 - Glöggler, Michael:
- Suchmaschinen im Internet. Funktionsweisen, Ranking-Methoden, Top-Positionen,
Seite 31-32,
Springer Verlag, Berlin, 1. Auflage 2003 (Xpert.press),
ISBN 354000212X - Jacobsen, Jens:
- Benutzerfreundlichkeit - Zum Benutzer freundlich sein,
http://www.contentmanager.de/magazin/benutzerfreundlichkeit_zum_benutzer_freundlich_sein.html, Contentmanager - Das Content Management Portal,
Datei vom 18.09.2006, Stand 15.02.2007