Grundlegendes zu XML

02.11.2016 06:30 Uhr

XML (Extensible Markup Language) ist eine Metasprache zur Auszeichnung von Texten nach Definitionen verschiedener  Dokumenttypen: XML liefert also Regeln, die beim Erzeugen von XML Instanzen angewendet werden müssen, damit ein standardisiertes Dokument als Datenbasis entsteht, das anschließend mit Softwarewerkzeugen weiter verarbeitet werden kann.

Sind diese Regeln vollständig eingehalten, spricht man von „Well-formedness“ (Wohlgeformtheit) einer XML Instanz. Diese muss gewährleistet sein, damit XML Prozessoren/Parser/Browser die XML-Dateien lesen können.

Es wird auf der Basis dieser Regeln mit einem einfachen Texteditor oder spezifischen XML Editoren verschachteltes deskriptives Markup (= semantische Tags) erzeugt, das eine Baumstruktur aufweist und einem bestimmten, in dem Dokumenttyp festgeschriebenen Konzept folgt.
 Mit welchen Elementen und auf welche Art und Weise die Verschachtelungen erfolgen sollen, wird für jeden Dokumenttypen in Form von Regeln in der Dokumenttyp-Definition festgelegt und unabhängig von den zu codierenden Daten in einer eigenen Datei definiert. Diese wird als Dokumenttyp-Definition (engl. document type definition, Abkürzung DTD) bezeichnet.

XML-fähige Software liest diese DTDs aus und beurteilen die Daten der darauf bezugnehmenden Instanz. Dabei kann die interpretierende Software feststellen, ob innerhalb der XML-Daten ungültige Notationen vorkommen. Das Verfahren zur Überprüfung einer XML-Datei nach den Regeln ihrer zugehörigen DTD, nennt man Validierung (von engl. valid = gültig).


Folgendes MUSS Beachtung finden:

  • XML-Deklaration:

    <?xml version="1.0" encoding="UTF-8" standalone="no"?>
  • Root-Element Alle Elemente sind Child-Elements des Root-Elementes Elemente bestehen grundsätzlich aus:

1. Start-Tag

2. Inhalt

3. End-Tag

und dürfen nicht überlappen.

  • Elementnamen können grundsätzlich frei gewählt werden, müssen aber mit einem Buchstaben oder einem Unterstrich beginnen und dürfen kein Leerzeichen oder Doppelpunkt enthalten. Ebenfalls untersagt sind Namen, die mit xml oder XML beginnen.
  • ACHTUNG: XML ist case-sensitive!
  • Elementen können Attribute zugewiesen werden, für die gilt:

1. pro Element ist der Attributname eindeutig.

2. Regeln für Attributname siehe Elementnamen.

  • Kommentare (Bereiche, die nicht interpretiert werden) stehen entweder zwischen Elementen oder umfassen Start- und End-Tag (Auskommentieren):

<Elementname >Inhalt</Elementname >

<!– Kommentar dazu –> … <!– <Elementname >Inhalt</Elementname > –>

Schlagwörter: