Grundsätzlicher Aufbau eines HTML Dokuments

24.10.2016 07:31 Uhr

Für alle HTML-Dokumente gilt grundsätzlich:

Jede Datei beginnt und endet mit der Metainformation html, da der Inhalt der gesamten Datei den Regeln der Markupsprache HTML folgt:

<html>...</html>

Das Dokument ist immer in zwei Teile geteilt. Der erste Teil (Header) wird verwendet, um allgemeine Angaben zum Dokument festzuhalten:

<head> ... </head>

In dem zweiten Teil, dem sogenannten Body, stehen alle Informationen, die im Anzeigebereich des Browsers dargestellt werden sollen:

<body> ... </body>

Innerhalb des Headers wird u.a. die Beschriftung des Browserfensters festgelegt. Dies erfolgt mittels des Tags

<title> ... </title>

Ein HTML Dokument (Version 4) sieht also grundsätzlich wie folgt aus:

<html>
    <head>
        <title>Titel der Seite</title>
    </head>
    <body>
        Inhalt der Seite
    </body>
</html>

Paare aus festgelegten „Starttags“ und „Endtags“ ( … ) verleihen dem dazwischen stehenden Text eine bestimmte (logische) Eigenschaft, die bei HTML meist Konsequenzen auf die Darstellung des Textes hat. Welche Tags verfügbar sind und welche Eigenschaften sie aufweisen, ist in der HTML 4.01 Specification des W3C festgelegt.

Diese Art der Metainformationscodierung lässt unmittelbar ein Problem entstehen: die Zeichen, die genutzt werden, um Metainformation von Information zu trennen (< und >), können nicht problemlos als Zeichen ausgegeben werden. Zu diesen sogenannten „nicht darstellbare Zeichen“ gehört auch das & und alle nationalen Sonderzeichen.

Um diese Zeichen dennoch nutzbar zu machen, wird ein Ersetzungsmechanismus eingesetzt, der als ‚benannte Zeichen’ oder Character Entities bezeichnet wird. Hierbei wird eine Ersetzung durch ein Kaufmanns-Und (&) eingeleitet und durch ein Semikolon (;) beendet. Zwischen diesen Markern wird ein Kommandowort eingefügt, das die Darstellung eines bestimmten „nicht darstellbaren Zeichens“ ermöglicht:

&Kommandowort;

Zeichen  Ersetzung
<  &lt;
>  &gt;
ä  &auml;
Ü  &Uuml;
ß  &szlig;
å  &aring;
®  &reg;
¥  &yen;
 …
Schlagwörter: