Handschrift-Anerkennung

Handschrift-Anerkennung ist die Fähigkeit eines Computers, verständlichen handschriftlichen Eingang von Quellen wie Papierdokumente, Fotographien, Sensorbildschirme und andere Geräte zu erhalten und zu interpretieren. Das Image des schriftlichen Textes kann "von der Linie" von einem Stück von Vortrag von der optischen Abtastung (optische Charakter-Anerkennung) oder intelligente Wortanerkennung gefühlt werden. Wechselweise können die Bewegungen des Kugelschreiber-Tipps "online" zum Beispiel durch eine Kugelschreiber-basierte Computerschirm-Oberfläche gefühlt werden.

Handschrift-Anerkennung hat hauptsächlich optische Charakter-Anerkennung zur Folge. Jedoch behandelt ein ganzes Handschrift-Anerkennungssystem auch Formatierung, führt richtige Segmentation in Charaktere durch und findet die plausibelsten Wörter.

Off-Lineanerkennung

Off-Linehandschrift-Anerkennung ist mit der automatischen Konvertierung des Textes in einem Image in Brief-Codes verbunden, die innerhalb des Computers und der textbearbeitenden Anwendungen verwendbar sind. Die durch diese Form erhaltenen Daten werden als eine statische Darstellung der Handschrift betrachtet. Off-Linehandschrift-Anerkennung ist verhältnismäßig schwierig, weil verschiedene Leute verschiedene Handschrift-Stile haben. Und, bezüglich heute, werden OCR-Motoren in erster Linie auf den gedruckten Text der Maschine und ICR für die Hand "gedruckt" (geschrieben in Großbuchstaben) Text eingestellt. Es gibt keinen OCR/ICR Motor, der Handschrift-Anerkennung bezüglich heute unterstützt.

Problem-Bereichsverminderungstechniken

Das Problem-Gebiet schmäler zu werden, hilft häufig, die Genauigkeit von Handschrift-Anerkennungssystemen zu vergrößern. Ein Form-Feld für eine Postleitzahl zum Beispiel, würde nur die Charaktere 0-9 enthalten. Diese Tatsache würde die Anzahl von möglichen Identifizierungen vermindern.

Primäre Techniken:

  • Das Spezifizieren spezifischen Charakters ordnet an
  • Anwendung von Spezialformen

Charakter-Förderung

Off-Linecharakter-Anerkennung ist häufig mit Abtastung einer Form oder Dokumentes geschrieben einmal in der Vergangenheit verbunden. Das bedeutet, dass die individuellen im gescannten Image enthaltenen Charaktere werden herausgezogen werden müssen. Werkzeuge bestehen, die dazu fähig sind, diesen Schritt jedoch, mehrere allgemeine Schönheitsfehler in diesem Schritt durchzuführen. Die allgemeinsten, die Charaktere sind, die zusammen verbunden werden, werden als ein einzelnes Subimage zurückgegeben, das beide Charaktere enthält. Das verursacht ein Hauptproblem in der Anerkennungsbühne. Und doch sind viele Algorithmen verfügbar, die die Gefahr von verbundenen Charakteren reduzieren.

Charakter-Anerkennung

Nachdem die Förderung von individuellen Charakteren vorkommt, wird ein Anerkennungsmotor verwendet, um den entsprechenden Computercharakter zu identifizieren. Mehrere verschiedene Anerkennungstechniken sind zurzeit verfügbar.

Nervennetze

Nervennetz recognizers erfährt von einem anfänglichen Bildlehrsatz. Das erzogene Netz macht dann die Charakter-Identifizierungen. Jedes Nervennetz erfährt einzigartig die Eigenschaften, die Lehrimages unterscheiden. Es sucht dann nach ähnlichen Eigenschaften im zu identifizierenden Zielimage. Nervennetze sind schnell, um sich niederzulassen; jedoch können sie ungenau sein, wenn sie Eigenschaften erfahren, die in den Zieldaten nicht wichtig sind.

Eigenschaft-Förderung

Eigenschaft-Förderungsarbeiten auf eine ähnliche Mode zum Nervennetz recognizers jedoch, Programmierer müssen die Eigenschaften manuell bestimmen, die sie fühlen, sind wichtig.

Einige Beispiel-Eigenschaften könnten sein:

  • Aspekt-Verhältnis
  • Prozent von Pixeln über der horizontalen Hälfte des Punkts
  • Prozent von Pixeln zum Recht auf die vertikale Hälfte des Punkts
  • Zahl von Schlägen
  • Durchschnittliche Entfernung vom Bildzentrum
  • Wird y Achse widerspiegelt
  • Wird x Achse widerspiegelt

Diese Annäherung gibt dem recognizer mehr Kontrolle über die in der Identifizierung verwendeten Eigenschaften. Und doch verlangt jedes System mit dieser Annäherung wesentlich mehr Entwicklungsdauer als ein Nervennetz, weil die Eigenschaften automatisch nicht erfahren werden.

Online-Anerkennung

Online-Handschrift-Anerkennung ist mit der automatischen Konvertierung des Textes verbunden, wie es über einen speziellen Digitalisierer oder PDA geschrieben wird, wo ein Sensor die Bewegungen des Kugelschreiber-Tipps sowie Pen-Up/pen-Down-Schaltung aufnimmt. Diese Art von Daten ist als Digitaltinte bekannt und kann als eine dynamische Darstellung der Handschrift betrachtet werden. Das erhaltene Signal wird in Brief-Codes umgewandelt, die innerhalb des Computers und der textbearbeitenden Anwendungen verwendbar sind.

Die Elemente einer Online-Handschrift-Anerkennungsschnittstelle schließen normalerweise ein:

  • ein Kugelschreiber oder Kopierstift für den Benutzer, um damit zu schreiben.
  • empfindliche Oberfläche einer Berührung, die mit, oder neben, eine Produktionsanzeige integriert werden kann.
  • eine Softwareanwendung, die die Bewegungen des Kopierstifts über die Schreiben-Oberfläche interpretiert, die resultierenden Schläge in den Digitaltext übersetzend.

Hardware

Kommerzielle Produkte, die Handschrift-Anerkennung als ein Ersatz für den Tastatur-Eingang vereinigen, wurden am Anfang der 1980er Jahre eingeführt. Beispiele schließen Handschrift-Terminals wie Pencept Penpad ein

und das Terminal des Punkts des Verkaufs von Inforite.

Mit dem Advent des großen Verbrauchermarktes für Personalcomputer wurden mehrere kommerzielle Produkte eingeführt, um die Tastatur und Maus auf einem Personalcomputer mit einem einzelnen System des Hinweisens/Handschrift, wie diejenigen von PenCept, CIC und anderen zu ersetzen.

Der erste gewerblich verfügbare Block-Typ tragbarer Computer war GRiDPad von Gittersystemen, veröffentlicht im September 1989. Sein Betriebssystem hat auf dem MS-DOS basiert.

Am Anfang der 1990er Jahre haben Hardware-Schöpfer einschließlich NCR, IBM und EO Block-Computer veröffentlicht, die PenPoint von GO Corp. entwickeltes Betriebssystem führen. PenPoint hat Handschrift-Anerkennung und Gesten überall verwendet und hat die Möglichkeiten der Drittsoftware zur Verfügung gestellt. Der Block-Computer von IBM war erst, um den Namen von ThinkPad zu verwenden, und hat die Handschrift-Anerkennung von IBM verwendet. Dieses Anerkennungssystem wurde später zu Windows von Microsoft für die Kugelschreiber-Computerwissenschaft und dem Kugelschreiber von IBM für OS/2 getragen. Keiner von diesen war gewerblich erfolgreich.

Förderungen in der Elektronik haben der für die Handschrift-Anerkennung notwendigen Rechenmacht erlaubt, einen kleineren Form-Faktor einzubauen, als Block-Computer, und Handschrift-Anerkennung wird häufig als eine Eingangsmethode für tragbaren PDAs verwendet. Der erste PDA, um schriftlichen Eingang zur Verfügung zu stellen, war der Apple Newton, der das Publikum zum Vorteil von einer stromlinienförmigen Benutzerschnittstelle ausgestellt hat. Jedoch war das Gerät nicht ein kommerzieller Erfolg infolge der Unzuverlässigkeit der Software, die versucht hat, Schreiben-Muster eines Benutzers zu erfahren. Zurzeit der Ausgabe des Newton OS 2.0, worin die Handschrift-Anerkennung einschließlich einzigartiger Eigenschaften außerordentlich verbessert wurde, die noch immer nicht in aktuellen Anerkennungssystemen wie Modeless-Fehlerkorrektur gefunden sind, war der größtenteils negative erste Eindruck gemacht worden. Nach der Unterbrechung von Apple Newton ist die Eigenschaft Mac OS X 10.2 oder später in der Form des Tintenfasses (Macintosh) getragen worden.

Palme hat später eine erfolgreiche Reihe von auf dem Graffiti-Anerkennungssystem gestütztem PDAs gestartet. Graffiti haben Brauchbarkeit durch das Definieren einer Reihe von "unistrokes" oder Eintaktformen für jeden Charakter verbessert. Das hat die Möglichkeit für den falschen Eingang eingeengt, obwohl memorization der Schlag-Muster wirklich die Lernkurve für den Benutzer vergrößert hat. Wie man fand, hat die Graffiti-Handschrift-Anerkennung in ein Patent eingegriffen, das durch Xerox gehalten ist, und Palme hat Graffiti durch eine lizenzierte Version der CIC Handschrift-Anerkennung ersetzt, die, während sie auch unistroke Formen unterstützt hat, das Xerox-Patent zurückdatiert hat. Das Gericht, das vom Verstoß findet, wurde auf der Bitte umgekehrt, und dann wieder auf einer späteren Bitte umgekehrt. Die Parteien haben eingeschlossen nachher hat eine Ansiedlung bezüglich dessen und anderer Patent-Graffiti (Palme OS) verhandelt.

Ein Block-PC ist ein spezieller Notizbuchcomputer, der mit einem Digitalisierer-Block und einem Kopierstift ausgerüstet wird, und einem Benutzer dem handwrite Text auf dem Schirm der Einheit erlaubt. Das Betriebssystem erkennt die Handschrift an und wandelt sie in den maschinegeschriebenen Text um. Windows-Aussicht und Windows 7 schließen Personalisierungseigenschaften ein, die Schreiben-Muster eines Benutzers und/oder Vokabular für Englisch, Japanisch, Chinesisch Traditionell, Chinesisch Vereinfacht und koreanisch erfahren. Die Eigenschaften schließen einen "Personalisierungszauberer" ein, der für Proben einer Handschrift eines Benutzers veranlasst und sie verwendet, um das System für die höhere Genauigkeitsanerkennung umzuschulen. Dieses System ist vom weniger fortgeschrittenen in seinem Windows verwendeten Handschrift-Anerkennungssystem Beweglicher OS für PDAs verschieden.

In den letzten Jahren wurden mehrere Versuche gemacht, Tintenkugelschreiber zu erzeugen, die Digitalelemente, solch einschließen, dass eine Person über Papier schreiben konnte, und den resultierenden Text digital versorgen lassen. Die am besten bekannten von diesen verwenden Technologie, die von Anoto entwickelt ist, der etwas Erfolg auf dem Ausbildungsmarkt gehabt hat. Der allgemeine Erfolg dieser Produkte soll noch bestimmt werden.

Obwohl Handschrift-Anerkennung eine Eingangsform ist, zu der das Publikum gewöhnt geworden ist, hat es weit verbreiteten Gebrauch entweder in Tischcomputern oder in Laptops nicht erreicht. Es wird noch allgemein akzeptiert, dass Tastatur-Eingang sowohl schneller als auch zuverlässiger ist., vieler PDAs-Angebot-Handschrift-Eingang, manchmal sogar natürliche kursive Handschrift, aber Genauigkeit akzeptierend, ist noch ein Problem, und einige Menschen finden noch sogar eine einfache Bildschirmtastatur effizienter.

Software

Anfängliche Softwaremodule konnten Druckhandschrift verstehen, wo die Charaktere getrennt wurden. Kommerzielle Beispiele sind aus Gesellschaften wie Communications Intelligence Corporation und IBM gekommen. Am Anfang der 90er Jahre haben zwei Gesellschaften, ParaGraph International und Lexicus Systeme präsentiert, die kursive Handschrift-Anerkennung verstehen konnten. ParaGraph hat in Russland basiert und hat durch den Computerwissenschaftler Stepan Pachikov gegründet, während Lexicus von Ronjon Nag und Chris Kortge gegründet wurde, die Studenten an der Universität von Stanford waren. ParaGraph System von CalliGrapher wurde in den Systemen des Apple Newton und dem Lexicus Langschriftsystem aufmarschiert, wurde gewerblich für PenPoint und Windows Betriebssystem bereitgestellt. Lexicus wurde von Motorola 1993 erworben und hat fortgesetzt, chinesische Handschrift-Anerkennung und prophetische Textsysteme für Motorola zu entwickeln. ParaGraph wurde 1997 durch SGI erworben, und seine Handschrift-Anerkennungsmannschaft hat sich P&I Abteilung geformt, die später von SGI durch Vadem erworben ist. Microsoft hat Handschrift-Anerkennung von CalliGrapher und andere Digitaltintentechnologien erworben, die durch P&I von Vadem 1999 entwickelt sind.

Wolfram Mathematica (8.0 oder später) stellt auch ein Handschreiben oder Text zur Verfügung, der Funktion anerkennt

kann durch das Schreiben des Befehls genannt werden TextRecognize [^] Benutzer kann dann das Bild schleppen, das auf dem Platz zu analysieren

ist

"^".

Ein modernes Handschrift-Anerkennungssystem kann im Betriebssystem des Microsofts gesehen werden, das auf Block-PCs (namentlich Windows XP Block-PC-Ausgabe, Windows-Aussicht und Windows 7) läuft. Es basiert auf einem Verzögerten Nervennetz (TDNN) classifier, mit einem Spitznamen bezeichnetem "Inferno", das an Microsoft gebaut ist. Später wurde eine Version von CalliGrapher, ein Nachfolger der Handschrift-Anerkennungssoftware, die auf Newton OS 2.0 verwendet ist, als ein sekundärer recognizer mit dem TDNN integriert. Die neue Generation der Software von CalliGrapher wird zurzeit für Windows verladen, das von PhatWare Corp. beweglich ist, die die Technologien von ParaGraph von Vadem 2001 lizenziert hat.

Die "dritte Generation" riteScript Handschrift-Anerkennungstechnologie, die von EverNote Corporation (der Nachfolger Pen&Internet Abteilung der Paraschrift) in 2000-2008 gebaut ist, wird in den ritePen und die Software von EverNote eingeschlossen. ritePen schließt auch Fusionstechnologie ein, die erlaubt, riteScript mit der eingebetteten Handschrift-Anerkennung in der Windows-Aussicht und Windows 7 zu verbinden, um Anerkennungsgenauigkeit jedes Handschrift-Anerkennungsmotors zu verbessern. RiteScript-Technologie ist auf Windows und Linux verfügbar.

CellWriter ist ein für Linux geschriebenes Handschrift-Anerkennungsprogramm des Open Sources. Es wurde in erster Linie von Michael Levin entwickelt, unter der Universität von Minnesotas Studentenforschungsgelegenheitsprogramm arbeitend. CellWriter wird entworfen, um von dem Schriftsteller abhängig zu sein, so ist Eingangsausbildung vor dem Gebrauch erforderlich. Es schließt einen englischen Wortanerkennungsmotor ein, um Anerkennungsgenauigkeit, einer Bildschirmtastatur und der Fähigkeit zur feinen Melodie oder den richtigen Fehlern durch ein Zusammenhang-Menü zu helfen. Verschieden von den meisten Anerkennungsmotoren sind der Quellcode und die Algorithmen verfügbar und frei herunterzuladen.

Baumeister von MyScript ist eine Handschrift-Anerkennung SDK von VisionObjects http://www.visionobjects.com/, der unter Gesellschaften populär ist, die Software für auf der Technologie von Anoto gestützte Digitalkugelschreiber entwickeln.

Eine Online-Handschrift-Anerkennung offenes Quellwerkzeug wird von HP-Laboratorien Indien an http://lipitk.sourceforge.net/zur Verfügung gestellt.

Das Kernwerkzeug ist eine Sammlung von Standardbausteinen (geschrieben in C ++), und bauen Sie Werkzeuge, die notwendig sind, um Online-Handschrift recognizers für neue Schriften für Windows oder Linux zu bauen. Das Kernwerkzeug wird an Forschern und Entwicklern mit einigen ausreichenden Kenntnissen ins Visier genommen, Anerkennungssysteme zu bauen. Es wird auch entworfen, um durch das Hinzufügen neuer Eigenschaften erweitert zu werden, recognizers und so weiter zu gestalten. Das Kernwerkzeug unterstützt zurzeit in erster Linie isolierte Anerkennung der Gestalt/Charakters und Anerkennung von in Schachteln gepackten Feldern des Textes.

Forschung

Handschrift-Anerkennung hat eine energische Gemeinschaft von Akademikern, die es studieren. Die größten Konferenzen für die Handschrift-Anerkennung sind die Internationale Konferenz für Grenzen in der Handschrift-Anerkennung (ICFHR), gehalten in sogar numerierten Jahren, und die Internationale Konferenz für die Dokumentenanalyse und Anerkennung (ICDAR), gehalten in ungeradzahligen Jahren. Beide dieser Konferenzen werden durch den IEEE geprüft. Aktive Gebiete der Forschung schließen ein:

  • Online-Anerkennung
  • Off-Lineanerkennung
  • Unterschrift-Überprüfung
  • Postadresse-Interpretation
  • Bankscheck, der in einer Prozession geht
  • Schriftsteller-Anerkennung

Ein Überblick über die Forschung über die Handschrift-Anerkennung ist durch R Plamondon und S. N. Srihari.

Kurze historische Zeichen

  • 1915: Das amerikanische Patent auf dem Handschrift-Anerkennungsbenutzer verbindet mit einem Kopierstift
  • 1957: Block von Stylator: Tom Dimond demonstriert elektronischen Block mit dem Kugelschreiber für den Computereingang und die Handschrift-Anerkennung
  • 1961: RAND Block hat erfunden: besser bekannt als früheres System von Stylator
  • 1962: Computeranerkennung der verbundenen Handschrift / Schrift-Handschrift
  • 1969: GRAL-System: Handschrift-Anerkennung mit der elektronischen Tintenanzeige, Geste befiehlt
  • 1973: Applicon Computersystem des CAD/NOCKENS mit Ledeen recognizer für die Handschrift-Anerkennung
  • Die 1980er Jahre: Einzelsysteme der Handschrift-Anerkennung: Pencept und CIC sowohl bieten PC-Computer für den Verbrauchermarkt mit einem Block als auch Handschrift-Anerkennung statt einer Tastatur und Maus an. Kader-Systemmärkte Terminal des Punkts des Verkaufs von Inforite das Verwenden der Handschrift-Anerkennung und eines kleinen elektronischen Blocks und des Kugelschreibers.
  • 1989: Tragbarer Handschrift-Anerkennungscomputer: GRiDPad von Gittersystemen.
  • 1997: Zuerst handschriftliches Adressinterpretationssystem (HWAI), der durch den USA-Postdienst aufmarschiert ist
  • 2007: Zuerst automatisches Schriftsteller-Anerkennungssystem: ZEDER-FUCHS.

Die umfassendere Information über die Geschichte der Handschrift-Anerkennungstechnologie kann im Artikel über Pen gefunden werden, die rechnet.

Siehe auch

  • AI Wirkung
  • Anwendungen der künstlichen Intelligenz
  • Handschrift-Bewegungsanalyse
  • Neocognitron
  • Optische Charakter-Anerkennung
  • Kugelschreiber, rechnend
  • Skizze-Anerkennung
  • Block-PC

Listen

  • Umriss der künstlichen Intelligenz
  • Liste von erscheinenden Technologien

Außenverbindungen


1888 in der Literatur / 1889 in der Literatur
Impressum & Datenschutz