Optische Charakter-Anerkennung

Optische Charakter-Anerkennung, die gewöhnlich zur OCR abgekürzt ist, ist die mechanische oder elektronische Konvertierung von gescannten Images des handschriftlichen, maschinegeschriebenen oder gedruckten Textes in den maschinenverschlüsselten Text. Es wird als eine Form des Datenzugangs von einer Art ursprünglicher Papierdatenquelle, ob Dokumente, Verkaufsquittungen, Post oder jede Zahl von gedruckten Aufzeichnungen weit verwendet. Es ist für die Automatisierung von gedruckten Texten entscheidend, so dass sie elektronisch gesucht, kompakter versorgt, online gezeigt, und in Maschinenprozessen wie maschinelle Übersetzung, Text zur Rede und Textbergwerk verwendet werden können. OCR ist ein Forschungsgebiet in der Muster-Anerkennung, künstlichen Intelligenz und Computervision.

Frühe Versionen mussten mit Images jedes Charakters programmiert werden, und haben an einer Schriftart auf einmal gearbeitet. "Intelligente" Systeme mit einem hohen Grad der Anerkennungsgenauigkeit für die meisten Schriftarten sind jetzt üblich. Einige Systeme sind dazu fähig, formatierte Produktion wieder hervorzubringen, die nah der ursprünglichen gescannten Seite einschließlich Images, Säulen und anderer Nichttextbestandteile näher kommt.

Geschichte

Früh konnte optische Charakter-Anerkennung zur Tätigkeit ungefähr zwei Probleme verfolgt werden: Erweiterung der Telegrafie und das Schaffen von Lesegeräten für den Rollladen. 1914 hat Emanuel Goldberg eine Maschine entwickelt, die Charaktere lesen und sie in den Standardtelegraf-Code umgewandelt haben. Um dieselbe Zeit hat Edmund Fournier d'Albe Optophone, einen tragbaren Scanner entwickelt, dass, wenn bewältigt, eine gedruckte Seite, erzeugte Töne, die spezifischen Briefen oder Charakteren entsprochen haben.

Goldberg hat fortgesetzt, OCR-Technologie für den Datenzugang zu entwickeln. Später hat er vorgehabt, Datenaufzeichnungen und dann mit Fotozellen zu fotografieren, die Fotos gegen eine Schablone vergleichend, die das gewünschte Identifizierungsmuster enthält. 1929 hatte Gustav Tauschek ähnliche Ideen, und hat ein Patent auf der OCR in Deutschland erhalten. Paul W. Handel hat auch ein US-Patent auf solcher Schablone vergleichender OCR-Technologie in den USA 1933 erhalten. 1935 wurde Tauschek auch ein US-Patent auf seiner Methode gewährt.

1949 haben RCA Ingenieure an der ersten primitiven Computertyp-OCR gearbeitet, um zu helfen, Leute für die US-Veteranregierung zu blenden, aber anstatt die gedruckten Charaktere umzuwandeln, um Sprache maschinell herzustellen, hat ihr Gerät es in die Maschinensprache umgewandelt und hat dann die Briefe gesprochen: eine frühe Technologie des Textes zur Rede. Es hat sich zu teuer erwiesen und wurde nach der Prüfung nicht verfolgt.

1950 hat David H. Shepard, ein cryptanalyst an der Streitkräfte-Sicherheit Agentur in den Vereinigten Staaten, das Problem gerichtet, gedruckte Nachrichten in die Maschinensprache für die Computerverarbeitung umzuwandeln, und hat eine Maschine gebaut, um das, genannt "Dingsbums" zu tun.. Er hat ein Patent für seinen "Apparat erhalten, um" 1953 Zu lesen. "Dingsbums" konnte 23 Briefe des englischen Alphabetes lesen, Morsezeichen-Code umfassen, Musiknotationen zu lesen, laut von gedruckten Seiten zu lesen, und maschinegeschriebene Seiten zu kopieren. Shepard ist zu gefundener Intelligent Machines Research Corporation (IMR) weitergegangen, der bald die ersten kommerziellen OCR-Systeme in der Welt entwickelt hat.

1955 wurde das erste kommerzielle System an der Auswahl des Lesers installiert, die OCR verwendet hat, um Verkaufsberichte in einen Computer einzugeben. Es hat die maschinegeschriebenen Berichte in geschlagene Karten für den Eingang in den Computer in der Abonnement-Abteilung der Zeitschrift, für die Hilfe in der Verarbeitung der Sendung von 15-20 Millionen Büchern pro Jahr umgewandelt. Das zweite System wurde an die Standardölfirma verkauft, um Kreditkartenabdrucke zu lesen, um Zwecke in Rechnung zu stellen. Andere Systeme, die durch IMR während des Endes der 1950er Jahre verkauft sind, haben einen Rechnungsstummel-Leser zu Ohio Bell Telephone Company und einen Seitenscanner zur USA-Luftwaffe eingeschlossen, um durch den Fernschreiber maschinegeschriebene Nachrichten zu lesen und zu übersenden. IBM und andere wurden später auf den OCR-Patenten von Shepard lizenziert.

Ungefähr 1965 haben die Auswahl und RCA des Lesers zusammengearbeitet, um einen OCR-Dokumentenleser zu bauen, der entworfen ist, um die Seriennummern auf den aus Anzeigen zurückgegebenen Auswahl-Gutscheinen des Lesers zu digitalisieren. Die auf den Dokumenten verwendeten Schriftarten wurden von einem RCA Trommel-Drucker gedruckt, der die Schriftart der OCR-A verwendet. Der Leser wurde direkt mit einem RCA 301 Computer (einer der ersten Computer des festen Zustands) verbunden. Diesem Leser wurde von einem an TWA installierten Spezialdokumentenleser gefolgt, wo der Leser Luftfahrtgesellschaft-Karte-Lager bearbeitet hat. Die Leser haben Dokumente an einer Rate von 1,500 Dokumenten pro Minute bearbeitet, und haben jedes Dokument überprüft, diejenigen zurückweisend, ist es nicht im Stande gewesen, richtig in einer Prozession zu gehen. Das Produkt ist ein Teil des RCA Erzeugnisses geworden, weil ein Leser vorgehabt hat in einer Prozession zu gehen, "Drehen Dokumente" wie diejenigen um Dienstprogramm und Versicherungsrechnungen sind mit Zahlungen zurückgekehrt.

Der USA-Postdienst hat OCR-Maschinen verwendet, um Post zu sortieren, die seit 1965 auf der Technologie gestützt ist, ausgedacht in erster Linie vom fruchtbaren Erfinder Jacob Rabinow. Der erste Gebrauch der OCR in Europa war durch das britische Hauptpostamt (GPO). 1965 hat es begonnen, ein komplettes Banksystem, den Nationalen Giro, mit der OCR-Technologie, ein Prozess zu planen, der Rechnungszahlungssysteme im Vereinigten Königreich revolutioniert hat. Posten von Kanada hat OCR-Systeme seit 1971 verwendet. OCR-Systeme lesen den Namen und Anschrift des Empfängers am ersten mechanisierten Sortieren-Zentrum, und drucken einen Routenplanungsstrichcode auf dem auf der Postleitzahl gestützten Umschlag. Um Verwirrung mit dem menschlich-lesbaren Adressfeld zu vermeiden, das überall auf dem Brief gelegen werden kann, wird spezielle Tinte (orange im sichtbaren Licht) verwendet, der unter dem ultravioletten Licht klar sichtbar ist. Umschläge können dann mit der auf einfachen Strichcode-Lesern gestützten Ausrüstung bearbeitet werden.

Wichtigkeit von der OCR zum Rollladen

1974 hat Ray Kurzweil die Gesellschaft Kurzweil Computer Products, Inc. angefangen und hat Entwicklung der Omni-Schriftart-OCR fortgesetzt, die in eigentlich jeder Schriftart gedruckten Text anerkennen konnte. Er hat entschieden, dass die beste Anwendung dieser Technologie eine Lesen-Maschine für den Rollladen würde schaffen sollen, der blinden Leuten erlauben würde, gelesenen Text eines Computers zu ihnen laut zu haben. Dieses Gerät hat die Erfindung von zwei Ermöglichen-Technologien — der CCD Flachbettscanner und der Synthesizer des Textes zur Rede verlangt. Am 13. Januar 1976 wurde das erfolgreiche Endprodukt während einer weit berichteten Pressekonferenz entschleiert, die von Kurzweil und den Führern der Nationalen Föderation des Rollladens angeführt ist. 1978 haben Computerprodukte von Kurzweil begonnen, eine kommerzielle Version des optischen Charakter-Anerkennungscomputerprogramms zu verkaufen. LexisNexis war einer der ersten Kunden, und hat das Programm gekauft, um Papier gesetzlich und Nachrichtendokumente auf seine werdenden Online-Datenbanken zu laden. Zwei Jahre später hat Kurzweil seine Gesellschaft an Xerox verkauft, der ein Interesse an der weiteren Kommerzialisieren-Textkonvertierung des Papiers zum Computer hatte. Xerox hat es schließlich von als Scansoft gesponnen, der sich mit Nuance-Kommunikationen verschmolzen hat.

OCR-Software

Arbeitsfläche & Server-OCR-Software

OCR-Software und ICR Softwaretechnologie sind analytische Systeme der künstlichen Intelligenz, die Folgen von Charakteren aber nicht ganzen Wörtern oder Ausdrücken denken. Gestützt auf der Analyse von folgenden Linien und Kurven machen OCR und ICR 'beste Annahmen' an Charakteren mit Datenbanknachschlagetabellen, um die Reihen von Charakteren diese Form Wörter nah zu vereinigen oder zu vergleichen.

WebOCR & OnlineOCR

DAMIT Technologieentwicklung ist die Plattform für Leute, Software zu verwenden, von der einzelnen PC-Plattform bis Mehrplattformen wie PC +Web-based + Wolkencomputerwissenschaft + Bewegliche Geräte geändert worden. Nach der Entwicklung von 30 Jahren hat OCR-Software angefangen, sich an neue Anwendungsvoraussetzungen anzupassen. WebOCR auch bekannt als OnlineOCR oder Webbasierter OCR-Dienst, ist eine neue Tendenz gewesen, größeres Volumen und größere Gruppe von Benutzern nach der Entwicklung von 30 Jahren der Tisch-OCR zu entsprechen. Internet und Breitbandtechnologien haben WebOCR & OnlineOCR praktisch verfügbar sowohl für individuelle Benutzer als auch für Unternehmenskunden gemacht. Seit 2000 haben einige Haupt-OCR-Verkäufer begonnen, Software von WebOCR & Online, mehrere neue Eintretender-Gesellschaften anzubieten, um die Gelegenheit zu greifen, innovativen Webbasierten OCR-Dienst zu entwickeln, von denen einige kostenlose Dienstleistungen sind.

Anwendungsbezogene OCR

Seitdem OCR-Technologie immer mehr auf die papierintensive Industrie weit angewandt worden ist, steht sie komplizierterer Bildumgebung in der echten Welt gegenüber. Zum Beispiel: Komplizierte Hintergründe, erniedrigte Images, schweres Geräusch, verdreht Papier, Bilderverzerrung, niedrige Entschlossenheit, die durch den Bratrost & die Linien, Textimage gestört ist, das aus speziellen Schriftarten, Symbolen, Wörterverzeichnis-Wörtern und usw. besteht. Alle Faktoren betreffen OCR-Produktstabilität in der Anerkennungsgenauigkeit.

In den letzten Jahren haben die Haupt-OCR-Technologieversorger begonnen, gewidmete OCR-Systeme, jeden für spezielle Typen von Images zu entwickeln. Sie verbinden verschiedene Optimierungsmethoden, die mit dem speziellen Image, wie Geschäftsregeln, Standardausdruck, Wörterverzeichnis oder Wörterbuch und reiche in Farbenimages enthaltene Information verbunden sind, um die Anerkennungsgenauigkeit zu verbessern.

Solche Strategie, OCR-Technologie kundengerecht anzufertigen, wird "Anwendungsbezogene OCR" oder "Kundengerecht angefertigte OCR" genannt, weit in den Feldern von Visitenkarte-OCR, Rechnungs-OCR, Screenshot-OCR, Ausweis OCR, OCR der Fahrer-Lizenz oder Auto-Werk OCR und so weiter verwendet.

Aktueller Staat der OCR-Technologie

Beauftragt vom amerikanischen Energieministerium (DOE) hatte Information Science Research Institute (ISRI) die Mission, die Verbesserung von automatisierten Technologien zu fördern, um zu verstehen, dass Maschine Dokumente gedruckt hat, und es den herrischsten vom Jährlichen Test der OCR-Genauigkeit seit 5 Konsekutivjahren Mitte der 90er Jahre geführt hat.

Anerkennung der lateinischen Schrift, maschinegeschriebener Text ist noch immer nicht um 100 % genau sogar dort, wo klare Bildaufbereitung verfügbar ist. Eine Studie, die auf der Anerkennung von 19. und Anfang Zeitungsseiten des 20. Jahrhunderts gestützt ist, hat beschlossen, dass zeichenweise sich die OCR-Genauigkeit für die kommerzielle OCR-Software von 71 % bis 98 % geändert hat; Gesamtgenauigkeit kann nur durch die menschliche Rezension erreicht werden. Andere Gebiete — einschließlich der Anerkennung des Handdruckes, der kursiven Handschrift und des gedruckten Textes in anderen Schriften (besonders jene ostasiatischen Sprachcharaktere, die viele Schläge für einen einzelnen Charakter haben) — sind noch das Thema der aktiven Forschung.

Genauigkeitsraten können auf mehrere Weisen gemessen werden, und wie sie gemessen werden, kann die berichtete Genauigkeitsrate außerordentlich betreffen. Zum Beispiel, wenn Wortzusammenhang (grundsätzlich ein Lexikon von Wörtern) nicht verwendet wird, um Software zu korrigieren, die nicht existierende Wörter findet, kann eine Zeichenfehler-Rate von 1 % (99-%-Genauigkeit) auf eine Fehlerrate von 5 % (95-%-Genauigkeit) oder schlechter hinauslaufen, wenn das Maß darauf basiert, ob jedes ganze Wort ohne falsche Briefe anerkannt wurde.

Online-Charakter-Anerkennung ist manchmal mit der Optischen Charakter-Anerkennung verwirrt (sieh Handschrift-Anerkennung). OCR ist ein Beispiel der Off-Linecharakter-Anerkennung, wo das System die feste statische Gestalt des Charakters anerkennt, während Online-Charakter-Anerkennung stattdessen die dynamische Bewegung während der Handschrift anerkennt. Zum Beispiel kann Online-Anerkennung, wie das, das für Gesten im Penpoint OS oder dem Block-PC verwendet ist, erzählen, ob ein horizontales Zeichen gezogenes Recht-zu-link, oder zum Recht nach links war. Auf Online-Charakter-Anerkennung wird auch durch andere Begriffe wie dynamische Charakter-Anerkennung, Echtzeitcharakter-Anerkennung, und Intelligente Charakter-Anerkennung oder ICR verwiesen.

Online-Systeme, um handbedruckten Text anzuerkennen, sind im Fluge weithin bekannt als kommerzielle Produkte in den letzten Jahren geworden (sieh Block-PC-Geschichte). Unter diesen sind die Eingangsgeräte für persönliche Digitalhelfer wie diejenigen, die Palme OS führen. Der Apple Newton hat für dieses Produkt den Weg gebahnt. Die in diesen Geräten verwendeten Algorithmen nutzen die Tatsache aus, dass die Ordnung, Geschwindigkeit und Richtung von individuellen Liniensegmenten am Eingang bekannt sind. Außerdem kann der Benutzer umgeschult werden, um nur spezifische Brief-Gestalten zu verwenden. Diese Methoden können in der Software nicht verwendet werden, die Papierdokumente scannt, so ist die genaue Anerkennung von handbedruckten Dokumenten noch größtenteils ein offenes Problem. Genauigkeitsraten von 80 % bis 90 % auf ordentlichen, sauberen handbedruckten Charakteren können erreicht werden, aber diese Genauigkeitsrate übersetzt noch zu Dutzenden von Fehlern pro Seite, die Technologie nützlich nur in sehr beschränkten Anwendungen machend.

Die Anerkennung des kursiven Textes ist ein aktives Gebiet der Forschung mit Anerkennungsraten noch tiefer als dieser des handbedruckten Textes. Höhere Raten der Anerkennung der allgemeinen kursiven Schrift werden wahrscheinlich ohne den Gebrauch der grammatischen oder Kontextinformation nicht möglich sein. Zum Beispiel ist das Erkennen kompletter Wörter aus einem Wörterbuch leichter als das Versuchen, individuelle Charaktere aus der Schrift grammatisch zu analysieren. Das Lesen der Betrag-Linie eines Schecks (der immer eine geschriebene Zahl ist) ist ein Beispiel, wo das Verwenden eines kleineren Wörterbuches Anerkennungsraten außerordentlich vergrößern kann. Kenntnisse der Grammatik der Sprache, die wird scannt, können auch helfen zu bestimmen, ob ein Wort wahrscheinlich ein Verb oder ein Substantiv sein wird, zum Beispiel größere Genauigkeit erlaubend. Die Gestalten von individuellen kursiven Charakteren selbst enthalten einfach genug Information zu genau nicht (größer als 98 %) erkennen die ganze handschriftliche kursive Schrift.

Es ist notwendig zu verstehen, dass OCR-Technologie eine grundlegende in fortgeschrittenen Abtastungsanwendungen auch verwendete Technologie ist. Wegen dessen kann eine fortgeschrittene Abtastungslösung einzigartig und patentiert und trotz des Basierens auf dieser grundlegenden OCR-Technologie nicht leicht kopiert sein.

Für kompliziertere Anerkennungsprobleme werden intelligente Charakter-Anerkennungssysteme allgemein verwendet, weil künstliche Nervennetze gleichgültig sowohl gegen affine als auch gegen nichtlineare Transformationen gemacht werden können.

Eine Technik, die beträchtlichen Erfolg im Erkennen schwieriger Wörter und Charakter-Gruppen innerhalb von der Computer-OCR allgemein zugänglichen Dokumenten hat, soll sie automatisch Menschen im reCAPTCHA System vorlegen.

Siehe auch

  • AI Wirkung
  • Anwendungen der künstlichen Intelligenz
  • Automatische Autokennzeichen-Anerkennung
  • Buch, scannend
CAPTCHA

Listen

  • Vergleich der optischen Charakter-Anerkennungssoftware
  • Liste von erscheinenden Technologien
  • Umriss der künstlichen Intelligenz

Außenverbindungen


Das Gesetz des Ohms / Der Regenbogen von Tom Clancy Sechs (Videospiel)
Impressum & Datenschutz