Extensible Hypertext Markup Language
Inhaltsübersicht:
HTML und XHTML im Vergleich
Die Extensible Hypertext Markup Language (XHTML) ist eine Neuformulierung der HTML-Sprachregeln in der XML, einer computerlesbaren Metasprache zum Formulieren der Regeln von Markup-Sprachen wie HTML. Die XHTML-Version 1.0 hat den gleichen Funktionsumfang wie die HTML-Version 4.01, in der Schreibweise gibt es jedoch einige syntaktische Abweichungen und Besonderheiten.
Die Spezifikation zu XHTML wird vom World Wide Web Consortium (W3C, siehe Accessibility) stetig weiterentwickelt. Um den Anpassungsaufwand auf eine neue Version so gering wie möglich zu halten, scheint es im Jahr 2009 zukunftssicherer, neue Webseiten in XHTML statt in HTML umzusetzen. Die spätere Konvertierung von XHTML-1.0-Dokumenten nach XHTML 2.0 ist vermutlich unproblematischer als eine Konvertierung von HTML 4.01.
Mit HTML5 und den damit einhergehenden Möglichkeiten hat im Jahr 2012 (entgegen früherer Annahmen) auch "reines" HTML wieder an Bedeutung gewonnen (siehe HTML5 und CSS3).
Deklaration und Definition
XHTML-Dokumente beinhalten
- eine XML-Deklaration,
- die Einbindung einer Dokumenttypdefinition und
- die Angabe des XML-Namensraumes.
Zur expliziten Kennzeichnung als XHTML-Dokument
wird eine spezielle Kopfzeile (<?xml ... ?>
)
eingefügt, in der zum einen die zugrundeliegende
XML-Version
(version="1.0"
) und zum anderen die Kennung
des benutzten Zeichensatzes (encoding="UTF-8"
)
festgelegt werden. UTF-8
(Unicode Transformation Format)
ist ein Zeichensatz mit variabler Zeichenlänge und der
Fähigkeit, die international verwendeten Schriften
repräsentieren zu können.
Über eine weitere Kopfzeile (<!DOCTYPE ...>
)
wird der Name des Wurzelelementes (html
)
genannt und die zu verwendende Document Type Definition
(DTD)
eingebunden.
Die DTD
ist eine Textdatei mit der Endung .dtd
, enthält
die zur Validität benötigten Element- und
Attributdeklarationen und definiert die Struktur eines Dokumentes:
Die Reihenfolge, in der Elemente und Attribute auftreten und wie
diese verschachtelt werden dürfen.
In XHTML gibt es drei mögliche DTD-Angaben:
- Strict
- Frameset
- Transitional
Die Strict-DTD definiert eine "normale" XHTML-Datei und wird für Inhaltsseiten verwendet. Mit dem Einbinden der Frameset-DTD wird eine mehrere Frames enthaltende Datei definiert. Die Transitional-DTD ist eine Verbindung der beiden vorgenannten DTDs, definiert sowohl Inhalts- als auch Frameset-Elemente und stellt eine Übergangslösung dar. Empfehlenswert und vor allem zukunftsorientiert ist die erstgenannte Variante Strict.
Im öffnenden <html>
-Element wird über
das xmlns
-Attribut der XML-Namensraum
angegeben, die Sprachangabe des Dokumentes im lang
-Attribut
ist optional.
Beispiel XHTML-Datei - Deklaration und Definition (Ausschnitt):
<!-- XML-Version und Zeichensatz -->
<?xml version="1.0"
encoding="UTF-8"?>
<!-- Wurzelelement und Document Type Definition -->
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<!-- XML-Namensraum und Sprachangabe -->
<html xmlns="http://www.w3.org/1999/xhtml"
lang="de"
xml:lang="de">
<!-- Beginn Dateikopf -->
<head>
[...]
<!-- Ende Dateikopf -->
</head>
<!-- Beginn Dateikörper -->
<body>
[...]
<!-- Ende Dateikörper -->
</body>
</html>
In HTML5 entfallen die Angaben zur Version, zur Typdefinition und zum Namensraum (siehe HTML5 zur Strukturierung).
XHTML-Dokumente
können wie HTML-Dokumente
als .htm
und .html
-Dateien gespeichert werden.
Auch die Endung .xhtml
kann verwendet werden. Besonders
zu beachten ist dann, dass neuere, XML-fähige
Browser (bspw.
der Microsoft Internet Explorer
ab Version 5) wenig fehlertolerant agieren und die Aufbereitung
eines Dokumentes bei Auftreten von Fehlern gegebenenfalls abbrechen.
Kopfbereich und Textkörper
XHTML-Dokumente bestehen weiterhin generell
- aus einem Kopfbereich (
<head>
-Element) und - einem Textkörper (
<body>
-Element).
Beide Bereiche werden, wie schon in HTML
üblich, in das <html>
-Element eingebettet
(siehe vorangegangenes Beispiel).
Im Unterschied zu Notationen in HTML ist zu beachten, dass
- alle Inhalte des Textkörpers in Blockelemente
wie bspw. Absätze
(
<p>
-Element) und Überschriften eingebettet werden müssen, - Elemente, Attribute und Attributwerte immer in Kleinbuchstaben dargestellt werden,
- Elemente, die kein Abschlusselement beinhalten,
durch einen Schrägstrich (
<br />
) beendet werden und - Attribute immer in Anführungszeichen
(
height="..."
) stehen.
Alle Elemente werden korrekt verschachtelt, unsauber geschachtelte Elemente, wie sie in HTML-Notation möglich waren, verursachen einen Fehler.
Beispiel XHTML-Datei - Verschachtelungen (Ausschnitt):
<p>Das ist ein
<strong>verschachtelter
Absatz</strong>.</p>
<p>Und jetzt folgt ein Bild:<br />
<img src="..."
height="..."
width="..." /></p>
Beispiel Mögliche, aber nicht valide HTML-Notation:
<!-- Falsch verschachtelte Elemente -->
<p>...<strong>...</p></strong>
Das Konzept von XHTML wird ständig weiterentwickelt. Elemente, die der Trennung von Inhalt und Gestaltung entgegenstehen, werden aus der Spezifikation entfernt und gelten als veraltet ("deprecated", auch übersetzt mit "missbilligt" oder "überholt").
Dazu zählen folgende Elemente:
<basefont>
<center>
<dir>
<font>
<isindex>
<menu>
<s>
<strike>
<u>
Das in HTML
oft verwendete <marquee>
-Element, das eine
Laufschrift erzeugt sowie das <blink>
-Element
werden zwar von einigen Browser-Umsetzungen
unterstützt, sind jedoch nicht standardisiert.
Das <font>
-Element bspw.,
das in HTML
zum Formatieren von Schriften innerhalb eines Dokumentes genutzt
wurde, entfällt bei barrierefreiem bzw.
barrierearmem Webdesign durch
das Trennen von Inhalt und Layout
und wird, ebenso wie alle anderen veralteten Elemente, über
externe Formatierungen in Style Sheet-Dateien
realisiert.
Weiterführende Literatur:
- Münz, Stefan:
- Professionelle Websites. Programmierung, Design und
Administration von Webseiten,
Seite 55 ff.,
Addison-Wesley Verlag, München, 2. überarbeitete Auflage 2006 (IX-Buchtipp),
ISBN 3827323703 - Prof. Dr. Hansen, Hans Robert und Prof. Dr. Neumann, Gustaf:
- Wirtschaftsinformatik I,
Seite 1007 und Seite 1046,
Lucius & Lucius Verlagsgesellschaft mbH, Stuttgart, 8. völlig neubearbeitete und erweiterte Auflage 2001,
ISBN 3828201954 - Münz, Stefan und Nefzger, Wolfgang:
- HTML
& Web-Publishing Handbuch, Band 1,
Seite 388 ff.,
Franzis' Verlag GmbH, Poing, 2002,
ISBN 3772375162 - Mintert, Stefan (Herausgeber):
- XHTML, CSS
& Co,
Seite 426 ff.,
Addison-Wesley Verlag, München, 1. Auflage 2003,
ISBN 3827318726 - Hellbusch, Jan Eric und Bühler, Christian (Herausgeber):
- Barrierefreies Webdesign,
Seite 178,
dpunkt-Verlag, Heidelberg, 1. Auflage 2005,
ISBN 3898642607