Klartext

In der Computerwissenschaft ist Klartext der Inhalt einer gewöhnlichen folgenden Datei lesbar als Textmaterial ohne viel Verarbeitung, die gewöhnlich dem formatierten Text und "binären Dateien" entgegengesetzt ist, in denen einige Teile als binäre Gegenstände (verschlüsselte ganze Zahlen, reelle Zahlen, Images, usw.) interpretiert werden müssen.

Die Verschlüsselung ist entweder ASCII, eine seiner vieler Ableitungen wie ISO/IEC 646 usw., oder manchmal EBCDIC traditionell gewesen. Mit Sitz in Unicode encodings wie UTF-8 und UTF-16 ersetzen die älteren ASCII auf 7 oder 8 Bit-Codes beschränkten Ableitungen allmählich.

Dateien, die Preiserhöhung oder andere Meta-Daten enthalten, werden allgemein als Klartext betrachtet, so lange die Gesamtheit in der direkt menschlich-lesbaren Form (als im HTML, XML und so weiter bleibt (als Talmulden, Wiedernahe, und DeRose streiten, ist Zeichensetzung selbst Preiserhöhung). Der Gebrauch des Klartextes aber nicht der Bit-Ströme, um Preiserhöhung auszudrücken, ermöglicht Dateien, viel besser "in freier Wildbahn", teilweise durch das Bilden von ihnen größtenteils geschützt zu Computerarchitektur-Inkompatibilitäten zu überleben.

Mehr formell ist die grundsätzliche Unterscheidung "des Klartextes", dass keine Information verloren würde, wenn Sie durchgehen würden und die Datei zu einer völlig verschiedenen Charakter-Verschlüsselung übersetzen würden, oder sie zu keiner Verschlüsselung übersetzen würden, indem Sie sie gerade allgemein ausgedruckt haben (vorausgesetzt dass der Drucker eine genug gute Schriftart hat, dass Sie alle Charaktere richtig unterscheiden können!). Keine Information wird durch die Tatsache befördert, dass ein "A" im Ausdruck als ein Byte mit dem Wert 65 ursprünglich versorgt wurde (wie es in ASCII sein würde), oder mit dem Wert 193 (als in EBCDIC); und das Byte, das als "A" sicher druckt, ist nicht gemeint geworden, um Hälfte der Bit in einer 2 Bytes groß-endian ganzen Zahl mit dem Wert 16640 auszudrücken.

Gebrauch

Der Zweck, Klartext zu verwenden, ist heute in erster Linie Unabhängigkeit aus Programmen, die ihre sehr eigene spezielle Verschlüsselung oder Formatierung, und von Computerarchitektur-Problemen wie Byte-Ordnung verlangen, usw. können Klartext-Dateien geöffnet werden, und editiert mit unzähligen allgemeinen Textaufbereitern und Dienstprogrammen zu lesen. Beispiele schließen Notizbuch (Windows) ein, editieren (DOS), Hrsg., emacs, vi, Schwung, Gedit oder nano (Unix, Linux), SimpleText (Mac OS) oder TextEdit (Mac OS X).

Viele andere Computerprogramme sind auch zur Verarbeitung oder dem Schaffen des Klartextes, wie unzählige Befehle in DOS, Windows, MacOS, und Unix und seiner Verwandtschaft fähig; sowie WWW-Browser (erzeugen einige Browser wie Luchs und der Linienweise-Browser nur Klartext für die Anzeige).

Klartext-Dateien sind fast in der Programmierung universal; eine Quellcodedatei, die Instruktionen auf einer Programmiersprache enthält, ist fast immer eine Klartext-Datei. Klartext wird auch für Konfigurationsdateien allgemein verwendet, die für gesparte Einstellungen beim Anlauf eines Programms, und für viel E-Mail gelesen werden.

Verschlüsselung

Charakter encodings

Vor dem Anfang der 1960er Jahre wurden Computer für das Zahl-Knirschen aber nicht für den Text hauptsächlich verwendet, und Gedächtnis war äußerst teuer. Computer haben häufig nur 6 Bit für jeden Charakter zugeteilt, nur 64 Charaktere erlaubend - der kein Zimmer für Kleinbuchstaben verlässt, nachdem Sie Codes für A-Z, 0-9, und sogar einen anderen Code für den Raum, die Zeichensetzung usw. zuteilen. Der grösste Teil der Hardware hat so nur Kleinbuchstaben und frühe Textprojekte wie der Index von Roberto Busa Thomisticus, das Braune Korpus unterstützt, und andere mussten die Vereinbarung wie Texteingabe eines Sternchens aufsuchen vorhergehende Briefe haben wirklich vorgehabt, Großschrift zu sein.

Fred Brooks von IBM hat stark gestritten, um zu 8-Bit-Bytes zu gehen, weil eines Tages Leute Text könnten bearbeiten wollen; und gewonnen. Obwohl IBM EBCDIC verwendet hat, ist der grösste Teil des Textes von da an gekommen, um in ASCII, mit Werten von 0 bis 31 für (nicht bedruckbare) Kontrollcharaktere und Werte von 32 bis 127 für Schriftzeichen wie Briefe, Ziffern und Zeichensetzung verschlüsselt zu werden. Die meisten Maschinen haben Charaktere in 8 Bit aber nicht 7 versorgt, das restliche Bit oder damit als eine Kontrollsumme ignorierend).

Die nahe Allgegenwart von ASCII war eine große Hilfe, aber hat gescheitert, internationale und linguistische Sorgen zu richten. Das Dollarzeichen (" $ ") war in England, und die akzentuierten Charaktere nicht so nützlich, die in Spanisch, Französisch, Deutsch verwendet sind, und viele andere Sprachen waren in ASCII völlig nicht verfügbar (um Charaktere nicht zu erwähnen, die in Griechisch, Russisch und den meisten Ostsprachen verwendet sind). Viele Personen, Gesellschaften und Länder haben Extracharaktere, wie erforderlich, definiert - häufig Kontrollcharaktere wiederzuteilend, oder Wert in der Reihe von 128 bis 255 verwendend. Mit Werten über 128 Konflikten mit dem Verwenden des 8. Bit weil ist eine Kontrollsumme, aber der Kontrollsumme-Gebrauch allmählich ausgestorben.

Diese zusätzlichen Charaktere wurden verschieden in verschiedenen Ländern verschlüsselt, Texte unmöglich machend, zu decodieren, ohne die Regierungen des Schöpfers auszurechnen. Zum Beispiel kann ein Browser ¬ A zeigen aber nicht, `wenn es versucht, eine Codierung als ein anderer zu interpretieren. Die Internationale Organisation für die Standardisierung (ISO) hat schließlich mehrere Codeseiten unter ISO 8859 entwickelt, um verschiedene Sprachen anzupassen. Der erste von diesen (ISO 8859-1) ist auch bekannt als "lateinischer 1", und bedeckt die Bedürfnisse nach meisten (nicht alle) europäische Sprachen, die lateinische Charaktere verwenden (es gab nicht ziemlich genug Zimmer, um sie alle zu bedecken). ISO 2022 hat dann Vereinbarung zur Verfügung gestellt, um zwischen verschiedenen Codierungen Mitte Datei "umzuschalten". Viele andere Organisationen haben Schwankungen auf diesen entwickelt, und viele Jahre lang haben Windows und Computer von Macintosh unvereinbare Schwankungen verwendet.

Die textverschlüsselnde Situation ist immer komplizierter geworden, zu Anstrengungen durch ISO und durch das Unicode Konsortium führend, um einen einzelnen, vereinigten Charakter zu entwickeln, der verschlüsselt, der alle bekannt (oder mindestens alle zurzeit bekannt) Sprachen bedecken konnte. Nach etwas Konflikt wurden diese Anstrengungen vereinigt. Unicode berücksichtigt zurzeit 1,114,112 Codewerte, und teilt Codes zu, die fast alle modernen Textschreiben-Systeme, sowie viele historische und für viele außersprachliche Charaktere wie die Fantasiezeichen des Druckers, mathematische Symbole usw. bedecken.

Text wird als Klartext unabhängig von seiner Verschlüsselung betrachtet. Um es richtig zu verstehen oder zu bearbeiten, muss der Empfänger wissen (oder im Stande sein auszurechnen), welche Verschlüsselung verwendet wurde; jedoch brauchen sie nichts über die Computerarchitektur zu wissen, die verwendet wurde, oder über die binären Strukturen, die durch beliebiges Programm (wenn irgendwelcher) definiert sind, die Daten geschaffen hat.

Kontrollcodes

Die ASCII-Codes vorher (= =) sind als displayable Charaktere, aber stattdessen als Kontrollcharaktere nicht beabsichtigt. Sie werden für verschiedene interpretierte Bedeutungen verwendet. Zum Beispiel wird der Code (=, manchmal angezeigt) als Schnur-Endanschreiber auf der Programmiersprache C und den Nachfolgern verwendet. Am lästigsten von diesen sind die Codes (= = =) und (= = =). Windows und OS/2 verlangen, dass die Folge einen newline vertritt, während Unix und Verwandte gerade verwenden

Siehe auch


Paul Auster / Presbyterianische Kirche (die Vereinigten Staaten).
Impressum & Datenschutz