Extensible Hypertext Markup Language

Die Extensible Hypertext Markup Language ist eine Neuformulierung der Hypertext Markup Language-Sprachregeln in der Extensible Markup Language und bildet somit die technologische Basis für barrierefreies bzw. barrierearmes Webdesign.
Stand 25.10.2012

Inhaltsübersicht:

  1. HTML und XHTML im Vergleich
  2. Deklaration und Definition
  3. Kopfbereich und Textkörper

HTML und XHTML im Vergleich

Die Extensible Hypertext Markup Language (XHTML) ist eine Neuformulierung der HTML-Sprachregeln in der XML, einer computerlesbaren Metasprache zum Formulieren der Regeln von Markup-Sprachen wie HTML. Die XHTML-Version 1.0 hat den gleichen Funktionsumfang wie die HTML-Version 4.01, in der Schreibweise gibt es jedoch einige syntaktische Abweichungen und Besonderheiten.

Die Spezifikation zu XHTML wird vom World Wide Web Consortium (W3C, siehe Accessibility) stetig weiterentwickelt. Um den Anpassungsaufwand auf eine neue Version so gering wie möglich zu halten, scheint es im Jahr 2009 zukunftssicherer, neue Webseiten in XHTML statt in HTML umzusetzen. Die spätere Konvertierung von XHTML-1.0-Dokumenten nach XHTML 2.0 ist vermutlich unproblematischer als eine Konvertierung von HTML 4.01.

Mit HTML5 und den damit einhergehenden Möglichkeiten hat im Jahr 2012 (entgegen früherer Annahmen) auch "reines" HTML wieder an Bedeutung gewonnen (siehe HTML5 und CSS3).

Seitenanfang

Deklaration und Definition

XHTML-Dokumente beinhalten

  • eine XML-Deklaration,
  • die Einbindung einer Dokumenttypdefinition und
  • die Angabe des XML-Namensraumes.

Zur expliziten Kennzeichnung als XHTML-Dokument wird eine spezielle Kopfzeile (<?xml ... ?>) eingefügt, in der zum einen die zugrundeliegende XML-Version (version="1.0") und zum anderen die Kennung des benutzten Zeichensatzes (encoding="UTF-8") festgelegt werden. UTF-8 (Unicode Transformation Format) ist ein Zeichensatz mit variabler Zeichenlänge und der Fähigkeit, die international verwendeten Schriften repräsentieren zu können.

Über eine weitere Kopfzeile (<!DOCTYPE ...>) wird der Name des Wurzelelementes (html) genannt und die zu verwendende Document Type Definition (DTD) eingebunden.

Die DTD ist eine Textdatei mit der Endung .dtd, enthält die zur Validität benötigten Element- und Attributdeklarationen und definiert die Struktur eines Dokumentes: Die Reihenfolge, in der Elemente und Attribute auftreten und wie diese verschachtelt werden dürfen.

In XHTML gibt es drei mögliche DTD-Angaben:

  • Strict
  • Frameset
  • Transitional

Die Strict-DTD definiert eine "normale" XHTML-Datei und wird für Inhaltsseiten verwendet. Mit dem Einbinden der Frameset-DTD wird eine mehrere Frames enthaltende Datei definiert. Die Transitional-DTD ist eine Verbindung der beiden vorgenannten DTDs, definiert sowohl Inhalts- als auch Frameset-Elemente und stellt eine Übergangslösung dar. Empfehlenswert und vor allem zukunftsorientiert ist die erstgenannte Variante Strict.

Im öffnenden <html>-Element wird über das xmlns-Attribut der XML-Namensraum angegeben, die Sprachangabe des Dokumentes im lang-Attribut ist optional.

Beispiel XHTML-Datei - Deklaration und Definition (Ausschnitt):

<!-- XML-Version und Zeichensatz --> <?xml version="1.0" encoding="UTF-8"?>
<!-- Wurzelelement und Document Type Definition --> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<!-- XML-Namensraum und Sprachangabe --> <html xmlns="http://www.w3.org/1999/xhtml" lang="de" xml:lang="de">
<!-- Beginn Dateikopf --> <head>
[...]
<!-- Ende Dateikopf --> </head>
<!-- Beginn Dateikörper --> <body>
[...]
<!-- Ende Dateikörper --> </body>
</html>

In HTML5 entfallen die Angaben zur Version, zur Typdefinition und zum Namensraum (siehe HTML5 zur Strukturierung).

XHTML-Dokumente können wie HTML-Dokumente als .htm und .html-Dateien gespeichert werden. Auch die Endung .xhtml kann verwendet werden. Besonders zu beachten ist dann, dass neuere, XML-fähige Browser (bspw. der Microsoft Internet Explorer ab Version 5) wenig fehlertolerant agieren und die Aufbereitung eines Dokumentes bei Auftreten von Fehlern gegebenenfalls abbrechen.

Seitenanfang

Kopfbereich und Textkörper

XHTML-Dokumente bestehen weiterhin generell

  • aus einem Kopfbereich (<head>-Element) und
  • einem Textkörper (<body>-Element).

Beide Bereiche werden, wie schon in HTML üblich, in das <html>-Element eingebettet (siehe vorangegangenes Beispiel).

Im Unterschied zu Notationen in HTML ist zu beachten, dass

  • alle Inhalte des Textkörpers in Blockelemente wie bspw. Absätze (<p>-Element) und Überschriften eingebettet werden müssen,
  • Elemente, Attribute und Attributwerte immer in Kleinbuchstaben dargestellt werden,
  • Elemente, die kein Abschlusselement beinhalten, durch einen Schrägstrich (<br />) beendet werden und
  • Attribute immer in Anführungszeichen (height="...") stehen.

Alle Elemente werden korrekt verschachtelt, unsauber geschachtelte Elemente, wie sie in HTML-Notation möglich waren, verursachen einen Fehler.

Beispiel XHTML-Datei - Verschachtelungen (Ausschnitt):

<p>Das ist ein <strong>verschachtelter Absatz</strong>.</p>
<p>Und jetzt folgt ein Bild:<br />
<img src="..." height="..." width="..." /></p>

Beispiel Mögliche, aber nicht valide HTML-Notation:

<!-- Falsch verschachtelte Elemente --> <p>...<strong>...</p></strong>

Das Konzept von XHTML wird ständig weiterentwickelt. Elemente, die der Trennung von Inhalt und Gestaltung entgegenstehen, werden aus der Spezifikation entfernt und gelten als veraltet ("deprecated", auch übersetzt mit "missbilligt" oder "überholt").

Dazu zählen folgende Elemente:

  • <basefont>
  • <center>
  • <dir>
  • <font>
  • <isindex>
  • <menu>
  • <s>
  • <strike>
  • <u>

Das in HTML oft verwendete <marquee>-Element, das eine Laufschrift erzeugt sowie das <blink>-Element werden zwar von einigen Browser-Umsetzungen unterstützt, sind jedoch nicht standardisiert.

Das <font>-Element bspw., das in HTML zum Formatieren von Schriften innerhalb eines Dokumentes genutzt wurde, entfällt bei barrierefreiem bzw. barrierearmem Webdesign durch das Trennen von Inhalt und Layout und wird, ebenso wie alle anderen veralteten Elemente, über externe Formatierungen in Style Sheet-Dateien realisiert.

Weiterführende Literatur:

Münz, Stefan:
Buchdeckel Professionelle Websites
Professionelle Websites. Programmierung, Design und Administration von Webseiten, Seite 55 ff.,
Addison-Wesley Verlag, München, 2. überarbeitete Auflage 2006 (IX-Buchtipp),
ISBN 3827323703
Prof. Dr. Hansen, Hans Robert und Prof. Dr. Neumann, Gustaf:
Buchdeckel Wirtschaftsinformatik I
Wirtschaftsinformatik I, Seite 1007 und Seite 1046,
Lucius & Lucius Verlagsgesellschaft mbH, Stuttgart, 8. völlig neubearbeitete und erweiterte Auflage 2001,
ISBN 3828201954
Münz, Stefan und Nefzger, Wolfgang:
Buchdeckel HTML-Handbuch
HTML & Web-Publishing Handbuch, Band 1, Seite 388 ff.,
Franzis' Verlag GmbH, Poing, 2002,
ISBN 3772375162
Mintert, Stefan (Herausgeber):
Buchdeckel XHTML, CSS und Co
XHTML, CSS & Co, Seite 426 ff.,
Addison-Wesley Verlag, München, 1. Auflage 2003,
ISBN 3827318726
Hellbusch, Jan Eric und Bühler, Christian (Herausgeber):
Buchdeckel Barrierefreies Webdesign
Barrierefreies Webdesign, Seite 178,
dpunkt-Verlag, Heidelberg, 1. Auflage 2005,
ISBN 3898642607

Seitenanfang