ISO/IEC 8859-1

ISO/IEC 8859-1:1998, Informationstechnologie — 8-Bit-einzelnes Byte hat Schriftzeichen-Sätze — Teil 1 codiert: Lateinisches Alphabet Nr. 1, ist ein Teil des ISO/IEC 8859 Reihen des ASCII-basierten Standardcharakters encodings, 1987 veröffentlichte Erstausgabe. Es wird informell lateinischen 1 genannt. Es ist allgemein für "westeuropäische" Sprachen beabsichtigt (sieh unten für eine Liste). Es ist bei weitem die populärste 8-Bit-Codierung in der Welt, und eigentlich teilt jede Codierung im modernen Gebrauch etwas Ähnlichkeit dazu (zum Beispiel es definiert die ersten 256 Codepunkt-Anweisungen in Unicode).

ISO-8859-1 ist bevorzugter Charset-Name des IANA für diesen Standard, wenn ergänzt, mit den C0- und C1-Kontrollcodes von ISO/IEC 6429. Die folgenden anderen Decknamen werden für ISO-8859-1 eingeschrieben: ISO_8859-1, iso-ir-100, csISOLatin1, latin1, l1, IBM819, CP819.

Windows 1252 codepage fällt mit ISO-8859-1 für alle Codes außer der Reihe 128 bis 159 zusammen (Hexe 80 zu 9F), wo die wenig verwendeten C1-Steuerungen durch zusätzliche Charaktere ersetzt werden. Windows 28591 ist der wirkliche ISO-8859-1 codepage.

Einschluss

ISO 8859-1 verschlüsselt, was er als "lateinisches Alphabet Nr. 1," kennzeichnet, aus 191 Charakteren aus der lateinischen Schrift bestehend. Dieses Charakter verschlüsselnde Schema wird überall in Den Amerikas, Westeuropa, Ozeanien und viel Afrika verwendet. Es wird auch in am meisten normalem romanizations von ostasiatischen Sprachen allgemein verwendet.

Jeder Charakter wird als ein einzelner Acht-Bit-Codewert verschlüsselt. Diese Codewerte können in fast jedem Datenaustausch-System verwendet werden, um auf den folgenden europäischen Sprachen (mit einigen Ausnahmen wegen fehlender Charaktere, wie bemerkt) zu kommunizieren:

Sprachen mit dem ganzen Einschluss

Sprachen allgemein unterstützt, aber mit dem unvollständigen Einschluss

Anführungszeichen

Weil einige über den richtigen typografischen Anführungszeichen verzeichnete Sprachen vermisst werden, weil nur "" "", und '' eingeschlossen werden. Auch dieses Schema sorgt orientiert (6- oder 9-Formen-) einzelne oder doppelte Anführungszeichen nicht. Einige Schriftarten werden den Abstand-Grab-Akzent (0x60) und der Apostroph (0x27) als ein zusammenpassendes Paar von orientierten einzelnen Anführungszeichen zeigen, jedoch wird das als ein Teil des modernen Standards nicht betrachtet.

Geschichte

ISO 8859-1 hat auf der Multinationalen Codierung basiert, die von Digital Equipment Corporation im populären VT220 Terminal verwendet ist. Es wurde innerhalb von ECMA, dem entwickelt

Europäische Computerhersteller-Vereinigung, und veröffentlicht im März 1985 als ECMA-94, durch den Namen es noch manchmal bekannt ist.

Die zweite Ausgabe von ECMA-94 (Juni 1986) hat auch ISO 8859-2, ISO 8859-3 und ISO 8859-4 als ein Teil der Spezifizierung eingeschlossen.

1985 hat Kommodore ISO 8859-1 für seinen neuen AmigaOS Betriebssystem angenommen. Der Seikosha Einfluss-Punktmatrix-Drucker des Abgeordneten-1300AI, der mit Amiga 1000 verwendet ist, hat diese Verschlüsselung eingeschlossen.

1992 hat der IANA die Charakter-Karte ISO_8859-1:1987 eingeschrieben, allgemeiner bekannt durch seinen bevorzugten PANTOMIME-Namen von ISO-8859-1 (bemerken Sie den Extrabindestrich über ISO 8859-1), eine Obermenge von ISO 8859-1, für den Gebrauch im Internet. Diese Karte teilt die C0- und C1-Kontrollcharaktere den unbestimmten Codewerten zu so sorgt für 256 Charaktere über jeden möglichen 8-Bit-Wert.

ISO-8859-1 ist (gemäß den Standards mindestens) die Verzug-Verschlüsselung von Dokumenten, die über HTTP mit einem Typ MIME geliefert sind, der mit dem "Text /" beginnt (jedoch der Entwurf HTML 5 Spezifizierung verlangt, dass Dokumente angekündigt als ISO-8859-1 wirklich mit der Verschlüsselung des Windows 1252 grammatisch analysiert werden.) Ist es die Verzug-Verschlüsselung der Werte bestimmter beschreibender HTTP Kopfbälle, und definiert das Repertoire von Charakteren, die im HTML 3.2 Dokumente erlaubt sind (HTML 4.0, jedoch, basiert auf Unicode). Wie man häufig annimmt, ist es und Windows 1252 die Verschlüsselung des Textes auf Windows von Unix und Microsoft ohne Schauplatz oder andere Information, das wird nur durch Unicode allmählich ersetzt, der wie UTF-8 oder UTF-16 verschlüsselt.

Lay-Out von Codepage

]] |125|175} }\

|

|

| -

!

||||||||||||||||| -!||||||||||||||||| -!||||||||||||||||| -!||||||||||||||||| -!

| |

| || || || || || || || || || || || || || || || -!| || || || || || || ||| || || || || || || || || -!| || || || || || || || || || || || || || || || || -!| || || || || || || ||| || || || || || || || |

| }\

Ähnliche Codierungen

ISO-8859-1 wurde als die ersten 256 Codepunkte von ISO/IEC 10646 und Unicode vereinigt.

Die niedrigere Reihe 32 bis 126 (Hexe 20 zu 7E, die G0 Teilmenge) Karten genau zu demselben haben G0 Teilmenge des ISO 646 US-Variante codiert (allgemein bekannt als ASCII), wessen ISO 2022-Standardschalter-Folge "ESC ist (B". Die höhere Reihe 160 bis 255 (Hexe A0 zu FF, der G1 Teilmenge) stellt genau zu derselben durch die ISO 2022-Standardschalter-Folge begonnenen Teilmenge "ESC kartografisch dar.".

ISO/IEC 8859-1 verpasst einige Charaktere für den französischen und finnischen Text und das Eurozeichen. Um einige dieser Charaktere zur Verfügung zu stellen, wurde ISO/IEC 8859-15 als eine Aktualisierung von ISO/IEC 8859-1 entwickelt. Das, hat jedoch, die Eliminierung von einigen selten verwendeten Charakteren von ISO/IEC 8859-1, einschließlich Bruchteil-Symbole und diakritischer Zeichen ohne Briefe verlangt: ¤, ¦, ', ¸, ¼, ½, und ¾.

Die populäre Codierung des Windows 1252 fügt alle fehlenden Charaktere hinzu, die durch ISO/IEC 8859-15, plus mehrere drucktechnische Symbole, durch das Ersetzen der selten verwendeten C1-Steuerungen in der Reihe 128 bis 159 (Hexe 80 zu 9F) zur Verfügung gestellt sind. Es ist für mislabel Textdaten mit dem Charset-Etikett-ISO-8859-1 sehr üblich, wenn auch die Daten wirklich verschlüsseltes Windows 1252 sind. Viele WWW-Browser und E-Mail-Kunden werden ISO-8859-1-Kontrollcodes als Charaktere des Windows 1252 interpretieren, um solchen mislabeling anzupassen, aber es ist nicht, sollten Standardverhalten und Sorge genommen werden, um zu vermeiden, diese Charaktere in ISO-8859-1 etikettierter Inhalt zu erzeugen.

Der Computer des Apple Macintosh hat einen Charakter eingeführt, der verschlüsselt, hat Mac Roman oder Makromann 1984 genannt. Es ist gemeint geworden, um für das westeuropäische Tischveröffentlichen passend zu sein. Es ist eine Obermenge von ASCII wie ISO-8859-1, und hat die meisten Charaktere, die in ISO-8859-1, aber in einer völlig verschiedenen Einordnung sind. Eine spätere Version, die mit IANA als "Macintosh" eingeschrieben ist, hat den allgemeinen Währungssymbol-¤ durch den Eurozeichen-€ ersetzt. Die wenigen druckfähigen Charaktere, die in ISO 8859-1, aber nicht in diesem Satz sind, sind häufig eine Quelle von Schwierigkeiten, wenn sie Text auf Websites mit älteren Browsern von Macintosh (einschließlich der letzten Version von Internet Explorer für Mac) editieren. Jedoch werden die Extracharaktere, die Windows 1252 in der Reihe von C1 codepoint hat, alle im Makromann unterstützt.

DOS hatte Codeseite 850, die alle druckfähigen Charaktere hatte, die ISO-8859-1 (obgleich in einer völlig verschiedenen Einordnung) plus die am weitesten verwendeten Schriftzeichen von der Codeseite 437 hatte.

Siehe auch

Außenverbindungen


Infusoria / ISO/IEC 8859
Impressum & Datenschutz