Status-Codes

Eine Website sollte lebendig sein und sich ständig weiterentwickeln. Beim Umsetzen einer neuen Struktur und der Umbenennung von Verzeichnis- oder Dateinamen ist jedoch Vorsicht geboten. Abhilfe können individualisierte Fehlerseiten und Redirects schaffen.
Stand 27.02.2009

Inhaltsübersicht:

  1. Fehlerabfrage durch Status-Codes
  2. Individualisierte Fehlerseite
  3. Zugriffsbeschränkung

Fehlerabfrage durch Status-Codes

Eine Website sollte lebendig sein und sich ständig weiterentwickeln. Vorsicht ist jedoch dabei geboten, eine neue Website-Struktur umzusetzen, Verzeichnis- und Dateinamen zu verändern oder Dateien einfach zu löschen. Oftmals werden die Inhalte auf neue Webseiten verteilt - zuungunsten der Suchmaschinen und vor allem der Nutzer, die nun auf einer Fehlerseite landen, wenn sie über die Ergebnislisten der Suchmaschinen kommen.

Individualisierte Fehlerseiten können auf solche Gegebenheiten hinweisen und den Nutzer zu den gewünschten Inhalten führen. Suchmaschinen müssen in diesem Fall noch feinfühliger behandelt werden und über sog. Redirects (dt. Umadressierungen) zur neuen Datei geleitet werden. Beide Angaben erfolgen in der .htaccess-Datei, einer Textdatei, die im Root-Verzeichnis der Domain abgelegt wird. Sie funktioniert jedoch nur, wenn der Server ein Apache-Webserver ist!

Über die .htaccess können verschiedene Status-Codes abgefragt und behandelt werden:

Status-Codes
Status-Codes Bedeutung Beschreibung
200 OK Das Dokument kann unter einem bestimmten URL erreicht und vom Webcrawler verarbeitet werden.
301 Moved Permanently Das Dokument kann auf Dauer unter einem anderen URL erreicht oder gelöscht werden.
302 Moved Temporarily Das Dokument kann temporär unter einem anderen URL erreicht oder gelöscht werden.
304 Not Modified Das Dokument wurde seit der letzten Abfrage nicht verändert.
401 Unauthorized Das Dokument unterliegt einer Autorisierung und kann daher nicht in den Datenbestand aufgenommen werden.
404 Not Found Das Dokument ist nicht mehr erreichbar und kann gelöscht werden.
500 Internal Server Error Das Dokument muss in eine Warteschlange aufgenommen werden, da es temporär, z.B. wegen Server-Überlastung, nicht abgerufen werden kann.

Einen entsprechenden Ausschnitt einer .htaccess-Datei zeigt das nachfolgende Beispiel:

Beispiel einer .htaccess-Datei (Ausschnitt):

<!-- Permanente Umleitung --> redirect 301 /alter_ordner/alte_datei.html http://www.domainname.de/neue_datei.html
<!-- Temporäre Umleitung --> redirect 302 /ordner/datei.html http://www.domainname.de/ordner/temp_datei.html
<!-- Fehlerseite bei geschützter Datei --> ErrorDocument 401 /code401.html
<!-- Fehlerseite bei nicht vorhandener Datei --> ErrorDocument 404 /code404.html

Seitenanfang

Individualisierte Fehlerseite

Die am Häufigsten auftauchende Fehlermeldung ist der Status Code 404 - Seite nicht gefunden. Auch hier ist Benutzerfreundlichkeit angebracht. Eine individualisierte Fehlerseite gehört zu jeder professionellen Website. Nutzer, die auf einer Fehlerseite landen, sind auf Hilfe angewiesen, bspw. durch Verweise auf die Homepage oder die Sitemap.

Eine Gestaltungsmöglichkeit einer solchen Fehlerseite zeigt das nachfolgende Beispiel:

Beispiel einer individualisierten Fehlerseite für Status-Code 404 (Ausschnitt):

[...]
<body>
<!-- Überschrift --> <h1>Seite nicht gefunden (Fehler 404)</h1>
<!-- 'Persönliche' Begrüßung, mögliche Gründe --> <p>Leider gibt es die von Ihnen angeforderte Seite nicht. Vielleicht ist die Adresse der Seite nicht richtig geschrieben oder eine Suchmaschine hat Sie zu einer veralteten Seite geschickt.</p>
<!-- Alternativen, Vorschläge --> <p>Versuchen Sie Folgendes:</p>
<ul>
  <li><a href="sitemap.html">zur Sitemap</a></li>
  <li><a href="index.html">zur Startseite</a></li>
</ul>
<!-- Möglichkeit zur Kontaktaufnahme --> <p>Falls Sie dennoch Probleme haben sollten, schreiben Sie uns:
<a href="mailto:support@itib.de">support@itib.de</a>!</p>
</body>
</html>

Seitenanfang

Zugriffsbeschränkung

Es gibt jedoch auch Dateien, die - temporär (noch nicht fertig gestellte Webseiten) oder konstant (Verzeichnisse mit Skript-Dateien) - vor Suchmaschinen verborgen bleiben sollen. Um eine Indizierung dieser bewusst zu verhindern, kann eine Datei, die robots.txt, im Root-Verzeichnis angelegt werden (siehe nachfolgendes Beispiel). Mit der User-agent-Angabe können Suchmaschinen namentlich Einzelanweisungen erhalten, im nachfolgenden Beispiel gelten die Angaben für jegliche Suchmaschinen und deren Webcrawler. Die Disallow-Angabe schließt die angegebenen Verzeichnisse und Dokumente explizit von der Indizierung aus.

Diese Datei sollte generell angelegt werden, da Webcrawler diese Datei verlangen und bei Nicht-Vorhandensein unbeantwortete Anfragen in den Logfiles des Webserver erzeugen. Wenn keine Restriktionen festgelegt werden brauchen, ist einfach eine leere Datei abzuspeichern. Dateien, die mit einem Passwortschutz belegt sind, werden von vornherein bei der Indizierung ausgeschlossen.

Beispiel einer Robots-Datei:

User-agent: *
Disallow: /scripts/
Disallow: /relaunch/
Disallow: /betriebsausflug/weihnachten2006.html

Weiterführende Literatur:

Erlhofer, Sebastian:
Buchdeckel Suchmaschinen-Optimierung
Suchmaschinen-Optimierung, Seite 249 ff. sowie Seite 255,
Galileo Computing, Bonn, 1. Auflage 2005 (Galileo Press),
ISBN 3898426203
Glöggler, Michael:
Buchdeckel Suchmaschinen im Internet
Suchmaschinen im Internet. Funktionsweisen, Ranking-Methoden, Top-Positionen, Seite 31-32,
Springer Verlag, Berlin, 1. Auflage 2003 (Xpert.press),
ISBN 354000212X
Jacobsen, Jens:
Symbol für 'Artikel im Web verfügbar'
Benutzerfreundlichkeit - Zum Benutzer freundlich sein,
http://www.contentmanager.de/magazin/benutzerfreundlichkeit_zum_benutzer_freundlich_sein.html, Contentmanager - Das Content Management Portal,
Datei vom 18.09.2006, Stand 15.02.2007

Seitenanfang