SELFHTML

Zeichenkodierungen (ISO-8859-Familie und andere)

Informationsseite

nach unten Die ISO-8859-Zeichenkodierungen
nach unten Liste der ISO-8859-Zeichenkodierungen
nach unten Alle offiziellen Zeichenkodierungen

 nach unten 

Die ISO-8859-Zeichenkodierungen

Die ISO-8859-Familie wurde vom European Computer Manufacturer's Association (ECMA) entwickelt. Es handelt sich um ein Set von standardisierten Zeichenkodierungen f�r alphabetische Schriften. Dazu geh�ren die lateinischen Schriften, auf denen die meisten Sprachen Westeuropas und Amerikas beruhen, oder etwa die kyrillischen Schriften.

Alle Kodierungen dieser Familie basieren auf der Speicherung eines Zeichens mit genau einem Byte. Das hei�t, die Codetabellen, auf denen diese Kodierungen aufbauen, enthalten 256 m�gliche Zeichen. Bei allen Codetabellen sind die ersten 128 Zeichen, also die Zeichen mit den Werten 0 bis 127, identisch mit der ASCII-Codetabelle. Das hat den Vorteil, dass die �blichen lateinischen Gro�- und Kleinbuchstaben, die arabischen Ziffern und die �blichen Sonderzeichen wie Satzzeichen oder kaufm�nnische Zeichen bei diesen Kodierungen immer zur Verf�gung stehen.

ASCII-Codetabelle

Oberhalb sind die darstellbaren Zeichen der ASCII-Codetabelle abgebildet. Diese Zeichen haben die Werte zwischen 32 und 126. Wert 32 ist das Leerzeichen. Alle ISO-8859-Codetabellen enthalten diese Codes.

Zur Lesart dieser und der folgenden Codetabellen:

Den Wert eines Zeichens, auch Codenummer genannt, ermitteln Sie, indem Sie die Werte aus Spalten- und Zeilen�berschrift des Zeichens addieren. Ein gro�es K hat in dieser Tabelle beispielsweise den Zeilenwert 70 und den Spaltenwert 5. Daraus ergibt sich der Wert 75 f�r dieses Zeichen. Falls Sie nicht den Dezimalwert eines Zeichens ben�tigen, sondern den Hexadezimalwert, k�nnen Sie den Seite Dezimal/Hexadezimal-Umrechner benutzen.

So wie in der ASCII-Codetabelle die ersten 32 Zeichen (Zeichenwerte 0 bis 31) und das Zeichen 127 f�r Steuerzeichen reserviert sind, sparen auch die erweiterten Codetabellen der ISO-8859-Kodierungen einen Bereich von Zeichen aus. Es handelt sich um die ersten 32 Zeichen oberhalb des ASCII-Bereichs, also um die Zeichenwerte 128 bis 159. Die Tabellen zu den einzelnen Kodierungen weiter unten bilden daher die verbleibenden Zeichenwerte 160 bis 255 ab. Das Zeichen mit dem Wert 160 ist in all diesen Tabellen ein erzwungenes Leerzeichen.

Viele der Codetabellen der ISO-8859-Kodierungen �berlappen sich. Das ist Absicht. Die Kodierungen sind so optimiert, dass sich mit einer m�glichst alle Zeichen m�glichst vieler Schriften speichern lassen. Zeichen, die in mehreren Codetabellen der ISO-8859-Kodierungen vorkommen, haben in der Regel immer den gleichen Wert, d.h. sie befinden sich in den unterschiedlichen Codetabellen an der gleichen Stelle.

Sechs der ISO-8859-Kodierungen beziehen sich auf Schriften, die im Kern auf der lateinischen Schrift basieren. Diese Kodierungen haben daher die Beinamen Latin-1 bis Latin-6.

nach obennach unten

Liste der ISO-8859-Kodierungen

Die folgenden Tabellen zeigen die einzelnen Codetabellen der ISO-8859-Kodierungen. Wenn Sie diese Kodierungen in HTML einsetzen m�chten, ben�tigen Sie einen HTML-Editor, der Ihnen das Speichern der HTML-Datei mit eben diesen Kodierungen erm�glicht. Zus�tzlich sollten Sie eineSeite Meta-Angabe zur Zeichenkodierung nicht vergessen. Die blau dargestellten Namen sind jene Bezeichnungen, die Sie in einer solchen Kodierungsangabe notieren k�nnen.

ISO-8859-1 (Latin-1)

Die Codetabelle dieser Kodierung enth�lt die schriftspezifischen Zeichen f�r westeurop�ische und amerikanische Sprachen. Der Zeichenvorrat deckt die Sprachen Albanisch, D�nisch, Deutsch, Englisch, F�r�isch, Finnisch, Franz�sisch, Galizisch, Irisch, Isl�ndisch, Italienisch, Katalanisch, Niederl�ndisch, Norwegisch, Portugiesisch, Schwedisch und Spanisch ab. Lediglich einzelne Zeichen wie das niederl�ndische ij, die franz�sischen Ligaturen œ und Œ oder die deutschen Anf�hrungszeichen „“ fehlen.

ISO-8859-1

ISO-8859-2 (Latin-2)

Die Codetabelle dieser Kodierung enth�lt die schriftspezifischen Zeichen f�r die meisten mitteleurop�ischen und slawischen Sprachen. Sie deckt die Sprachen Kroatisch, Polnisch, Rum�nisch, Slowakisch, Slowenisch, Tschechisch und Ungarisch ab.

ISO-8859-2

ISO-8859-3 (Latin-3)

Die Codetabelle dieser Kodierung deckt die Sprachen Esperanto, Galizisch, Maltesisch und T�rkisch ab.

ISO-8859-3

ISO-8859-4 (Latin-4)

Die Codetabelle dieser Kodierung enth�lt einige Zeichen der Sprachen Estnisch, Lettisch und Litauisch. Vergleichen Sie diese Kodierung auch mit ISO 8859-10, deren Codetabelle sehr �hnlich ist.

ISO-8859-4

ISO-8859-5

Die Codetabelle dieser Kodierung enth�lt kyrillische Zeichen. Sie deckt weitgehend die Sprachen Bulgarisch, Mazedonisch, Russisch, Serbisch und Ukrainisch ab.

ISO-8859-5

ISO-8859-6

Die Codetabelle dieser Kodierung enth�lt Zeichen arabischer Schrift. Die Darstellung der Zeichen in der folgenden Tabelle ist jedoch "abstrakt", da die Zeichen in der Schriftpraxis variieren, je nachdem, ob sie am Anfang, in der Mitte oder am Ende eines Wortes oder einzeln stehen. Arabisch zeichnet sich weiterhin dadurch aus, dass die Schriftrichtung von rechts nach links ist.

ISO-8859-6

ISO-8859-7

Die Codetabelle dieser Kodierung enth�lt die Zeichen der neugriechischen Schrift.

ISO-8859-7

ISO-8859-8

Die Codetabelle dieser Kodierung enth�lt die Zeichen der hebr�ischen Schrift. Wie bei der arabischen Schrift ist dabei die Schriftrichtung von rechts nach links.

ISO-8859-8

ISO-8859-9 (Latin-5)

Diese Kodierung ist speziell f�r T�rkisch gedacht. Die Codetabelle basiert auf ISO 8859-1, enth�lt jedoch anstelle der isl�ndischen Sonderzeichen t�rkische Zeichen.

ISO-8859-9

ISO-8859-10 (Latin-6)

Die Codetabelle dieser Kodierung enth�lt speziell Zeichen f�r die Sprachen Gr�nl�ndisch (Inuit) und Lappisch (Sami).

ISO-8859-10

nach obennach unten

Alle offiziellen Kodierungen

Es gibt etliche andere, zum Teil schon �ltere Kodierungen, die Konventionen f�r einzelne Schriften oder Schriftfamilien definieren, h�ufig landesspezifisch. Unter der folgenden Web-Adresse werden die Namen dieser Kodierungen gesammelt:

englischsprachige Seite http://www.iana.org/assignments/character-sets

Diejenigen Kodierungsnamen, die dort in der Liste jeweils hinter Name: oder Alias: aufgelistet sind, k�nnen Sie in HTML in der Seite Meta-Angabe zur verwendeten Zeichenkodierung verwenden. Bevorzugt sollten Sie jene Namen verwenden, die in der Liste mit dem Zusatz preferred MIME name gekennzeichnet sind.

 nach oben
weiter Seite Das Unicode-System
zur�ck Seite Computer und geschriebene Sprache
 

© 2007 Seite Impressum