Grundlegendes zu SGML

02.11.2016 08:30 Uhr

In der Welt des Mark-Up’s existieren sogenannte Metasprachen, die ein Regelwerk zur Verfügung stellen, mit dem es möglich ist, spezielle Sprachen, sogenannte Objektsprachen, für einen bestimmten Sinn und Zweck zu formulieren. SGML, die Standard Generalized Markup Language oder Normierte Verallgemeinerte Auszeichnungssprache, setzte sich 1986 gegen andere gleichartige Ideen durch, erlangte aber aufgrund seiner Komplexität keinen Durchbruch auf breiter Front.

Um eine Objektsprache, die auf SGML basiert, zu formulieren, muss eine Dokumententypdefinition, eine DTD verfasst werden. Diese enthält Regeln, die den Einsatz und die Art der Elemente, den sogenannten Tags, für einen bestimmten Zweck festlegen. So wurde die DTD für HTML zum Zweck der Strukturierung von Inhalten wie Texten, Bildern und Hyperlinks in Dokumenten verfasst.

Mittels dieses Regelwerkes (siehe http://www.w3.org/TR/html5/) ist es nun möglich, Dokumente so auszuzeichnen, dass sie als maschinenlesbare Hypertextdokumente genutzt werden können.

Des Weiteren existieren viele DTDs, die andere Ziele verfolgen:

  • TEI: Dokumentformat zur Kodierung und für den Austausch von Texten (auch als XML basierte Version verfügbar)
  • EAD: Standard zur Beschreibung von Findbüchern und anderen Findhilfen in Archiven (auch als XML basierte Version verfügbar)
  • DocBook: Standard zur Erstellung von (technischer) Dokumentation (auch als XML basierte Version verfügbar)

Die Überprüfung der Regelkonformität wird mittels eines Parsers vorgenommen. Ein SGML-Parser liest die DTD und überprüft ob diese Regeln in dem entsprechenden Dokument eingehalten wurden. Ist dies der Fall, spricht man von einem validen Dokument.

Da sich SGML letztlich nicht durchsetzen konnte, wurde ein neue Metasprache ins Leben gerufen, die eine Untermenge von SGML darstellt und damit nicht die Komplexität aber eine größere Flexibilität aufweist. Es handelt sich um XML, die Extensible Markup Language, die sich seit einiger Zeit größter Beliebtheit erfreut. Diesem Erfolg ist es geschuldet, dass alle bekannten SGML-Anwendungen nun auch als XML-Anwendungen zur Verfügung stehen und neben dem SGML basierten HTML auch ein XML basiertes HTML existiert.

Schlagwörter: