Multimedia-Datenformate HTML (Hypertext Markup Language) ist ein Format zur Darstellung von Informationen aller Art, unabhängig vom verwendeten Betriebssystem oder Rechner. Dieser Text beschreibt den Syntax des HTML-Formats, den grundsätzlichen Aufbau von HTML-Dokumenten, die vorhandenen Formatierbefehle, das Anlegen von Verweisen zu anderen Dokumenten und wie man Grafiken einbindet. Weiterhin wird gezeigt, wie man durch Skripten interaktiv mit dem Leser kommunizieren und auf externe Datenquellen zugreifen kann. Am Schluß erfolgt noch ein Ausblick auf HTML+, eine Erweiterung von HTML.
Man unterscheidet verschiedene Stufen von HTML-Befehlen:
<HTML> und abgeschlossen
durch </HTML>.
Innerhalb des Dokumentes gibt es den Kopfteil, begrenzt durch
<HEAD> und </HEAD>, der nur einige ausgewählte administrative
Daten, jedoch keinen Text enthalten darf, und den Hauptteil, begrenzt durch
<BODY> und </BODY>.
Innerhalb des Hauptteils befinden sich sämtliche Informationen und Steueranweisungen,
die das Dokument darstellen soll.
Die im Kopf erlaubten Elemente sind im einzelnen:
<TITLE>
<ISINDEX>
<BASE>
<LINK>
<NEXTID>
<H1> <H2> <H3> <H4> <H5> <H6>
<H1> ist die oberste Stufe, mit ihr sollte der Beginn eines
Dokumentes überschrieben
werden. Es ist nicht empfehlenswert, beim Erstellen von Unter-Überschriften
einzelne Stufen zu überspringen.
<!-- und -->,
sie dürfen allerdings nicht verschachtelt werden.
Kommentare werden vom Browser ignoriert und nicht angezeigt.
<BR>-Anweisung.
<P>
markiert, er führt standardmäßig
beim Browser dazu, den Text nach etwas Abstand zu Beginn einer neuen Zeile
fortzuführen.
<PRE> und </PRE>
eingeschlossen werden. Text innerhalb dieser Tags wird in der Regel in einem
nichtproportionalen Zeichensatz dargestellt, wobei alle Leerzeichen und -zeilen
sowie Zeilenumbrüche direkt übernommen werden. Sämtliche HTML-Tags behalten
jedoch ihre Gültigkeit und werden auch innerhalb des
<PRE>-Blocks dargestellt.
<BLOCKQUOTE>
und </BLOCKQUOTE>. Text
innerhalb dieser Tags wird normalerweise vom Browser eingerückt oder in
Schrägschrift und als separater Absatz mit etwas Abstand zum normalen
Text angezeigt.
<TT><B><I><U><EM><STRONG><CODE><SAMP><KBD><VAR><DFN><CITE><CMD>rm</CMD> [<ARG>-r</ARG>] [<ARG>-f</ARG>] <VAR>filename</VAR>
<UL>. Sie zählen die einzelnen Elemente ohne laufende Numerierung
auf, stattdessen wird ein neutrales Aufzählungszeichen vorangestellt. Welches
Zeichen dazu verwendet wird ist Browser-abhängig, möglich sind z.B. Punkte, Striche
oder Sternchen. Jedes Listenelement wird eingeleitet durch <LI>.
<OL>
<DL>, der Titel durch
<DT> und der Beschreibungstext selbst durch <DD>.
<MENU> oder <DIR>.
<MENU> ist eine in der Darstellung etwas kompaktere Form von <UL>,
<DIR> ist für eine Liste von kürzeren Elementen gedacht, die auch in
mehreren Spalten auf dem Bildschirm dargestellt werden können.
Listen können beliebig verschachtelt werden, man sollte sich jedoch nicht darauf
verlassen, daß der Browser die einzelnen Verschachtelungsebenen hinreichend
eindeutig darstellen kann (z.B. durch Wechsel des Aufzählungszeichens).
Danach wird das Tag mit
Hier einige Beispiele:
Willkommen bei der Mutter aller WWW-Seiten.
Naehere Information erhalten Sie in Kapitel 17.
...
Kapitel 17
Man sollte mit eingebundenen Grafiken sehr sparsam umgehen, da der Betrachter bei
Anwählen der Seite nicht über die Menge der Grafiken informiert und so
völlig unvorbereitet von diesen "überflutet"wird. Insbesondere bei
sehr langsamen Übertragungsleitungen ist dies ein Ärgernis. Viele Browser geben
dem Benutzer auch die Möglichkeit, das automatische Laden von eingebundenen Grafiken
auszuschalten und diese erst auf Wunsch anzuzeigen.
Beispiele:
Links zu anderen Dokumenten
Ein Link wird eingeleitet durch <A (A steht für "Anchor"), gefolgt
von einem oder mehreren der folgenden Parameter:
Alle diese Parameter sind optional, jedoch macht ein Link ohne HREF- oder
NAME-Parameter nicht viel Sinn.
REL="X"
ist das gleiche
wie ein Link von B nach A mit REV="X".
<TITLE>
definierten im Kopf des Zieldokumentes.
> beendet, gefolgt vom Text oder
der Grafik, welche den Link repräsentieren sollen. Abgeschlossen wird der
Link durch </A>.
Willkommen bei der
<A HREF="http://info.cern.ch/hypertext/WWW/MarkUp/MarkUp.html">
Mutter aller WWW-Seiten</A>.
Naehere Information erhalten Sie in <A HREF="#kapitel17">Kapitel 17</A>.
...
<A NAME="kapitel17">Kapitel 17
Durch den Browser formatiert könnte das etwa so aussehen:
Grafiken
Grafiken können auf zwei Arten in HTML-Dokumente eingebunden werden, einmal über
Hyperlinks, hier wird die Grafik erst bei Anwählen des
Links geladen und über ein Anzeigeprogramm dargestellt, oder als sogenanntes
"inline image", hier befindet sich dir Grafik im Dokument zwischen
dem Text und wird direkt bei Laden des Dokumentes mitgeladen und angezeigt.
Der Befehl zum Einbau von Grafiken lautet
<IMG SRC="Bild-URL" ALIGN="Textansatz" ALT="Alternativdarstellung">
Grafiken können auch innerhalb von Links verwendet werden, so daß ein Anwählen
der Grafik zu einem neuen Dokument führt. Dies wird folgendermaßen realisiert:
<IMG> nachfolgenden
Textzeilen beginnen sollen, an der Oberkante, in der Mitte oder der Unterkante
des Bildes. Mögliche Werte sind TOP, MIDDLE oder BOTTOM. Diese
Angabe ist freiwillig, der voreingestellte Wert ist BOTTOM.
IMAGE.
<A HREF="anderes_Dokument.html"><IMG SRC="button.gif">Click!</A>
Hier sind sowohl das Wort "Click!" als auch die Grafik sensitiv.
Sonderzeichen
Der für HTML gültige Zeichensatz ist ISO Latin-1 (ISO 8859-1). Auf Rechenanlagen,
die nur in der Lage sind, 7-Bit-Zeichen darzustellen, können Zeichen oberhalb
von 127 durch spezielle "character entities"gebildet werden. Diese
beginnen immer mit einem Kaufmannsund (&), gefolgt vom Zeichennamen und
abgeschlossen durch ein Semikolon. Auf diese Weise können alle Sonderzeichen
dargestellt werden, auch wenn sie auf dem Rechner oder der Tastatur des
Dokumentenautors nicht verfügbar sind. Das deutsche "ä" wird
beispielsweise durch ä repräsentiert, ein "Ä" wäre
Ä, ein "ß" wäre ß. Das
Kaufmannsund selbst wird durch & dargestellt. Für eine komplette
Liste aller verfügbaren Zeichennamen siehe http://www.uni-passau.de/~ramsch/iso8859-1.html.
Was ist ein URL?
URL steht für Uniform Resource Locator und ist eine Referenz auf eine
Datei oder sonstige Ressource. Diese Referenz wird benötigt z.B. beim Einbinden
von Grafiken oder bei Links zwischen Dokumenten. Das Aufbau-Schema eines
URLs ist
dienst://host.domain[:port]/pfad/dateiname
Die Angabe des Ports kann meist entfallen, es wird dann der für den
angegebenen Dienst definierte Standardport verwendet.
Als Dienste werden nahezu alle bekannten Internet-Dienste unterstützt. Die
wichtigsten sind
Weitere Dienste, auf die ein URL verweisen kann sind WAIS, telnet, tn3270 oder
news.
Fuer den Index vom AmiNet bitte
<A HREF="ftp://ftp.uni-paderborn.de/pub/aminet/INDEX">hier anklicken</A>.
...
Bei Nichtgefallen einfach eine <A HREF="mailto:ukbx@rz.uni-karlsruhe.de">
Mail an mich schicken</A>
Browser
Die Funktionsweise eines Browsers
Ein Browser ist ein Programm, das ein HTML-Dokument einliest, die darin
enthaltenen HTML-Befehle interpretiert und darstellt. Meist sind
sie WorldWideWeb-Browser, d.h. sie sind auch in der Lage, eine Verbindung
zu einem anderen Rechner im Internet aufzubauen und von dort€o tels