Eurotra

Eurotra war ein ehrgeiziges Projekt der maschinellen Übersetzung, das gegründet und von der Europäischen Kommission vom Ende der 1970er Jahre bis 1994 gefördert ist.

Ermutigt durch den bescheidenen Erfolg mit einem älteren, gewerblich entwickelten System der maschinellen Übersetzung SYSTRAN hat ein großes Netz von europäischen rechenbetonten Linguisten das Projekt von Eurotra mit der Hoffnung darauf unternommen, ein modernstes MT-System für die dann sieben, später neun, offizielle Sprachen der Europäischen Gemeinschaft zu schaffen.

Jedoch, weil Zeit gegangen ist, sind Erwartungen gehärtet geworden; "Vollautomatische Hohe Qualitätsübersetzung" war nicht eine vernünftig erreichbare Absicht. Wie man schließlich anerkannte, war der wahre Charakter von Eurotra tatsächlich Vorwettbewerbsforschung aber nicht Prototyp-Entwicklung.

Das Projekt wurde durch einen der Gründungsgrundsätze der EU motiviert: Das alle Bürger hatte das Recht, irgendwelchen und alle Verhandlungen der Kommission auf ihrer eigenen Sprache zu lesen. Da sich mehr Länder angeschlossen haben, hat das eine kombinatorische Explosion in der Zahl von Sprachpaaren beteiligt, und das Bedürfnis erzeugt, jede Zeitung, Rede zu übersetzen, und sogar der Satz von Versammlungsminuten, die durch die EU in die anderen acht Sprachen erzeugt sind, hat bedeutet, dass Übersetzung schnell der überwältigende Bestandteil im Verwaltungsbudget geworden ist. Um dieses Problem zu beheben, wurde Eurotra ausgedacht.

Das Projekt war darin ungewöhnlich, anstatt aus einer einzelnen Forschungsmannschaft zu bestehen, es hat Mitglied-Gruppen um die Mitgliedsländer verteilen lassen, die entlang der Sprache aber nicht den nationalen Linien organisiert sind (zum Beispiel, Gruppen in Leuven und Utrecht haben nah zusammen gearbeitet), und das Sekretariat hat an der Europäischen Kommission in Luxemburg basiert. Während das bedeutsam zur Kultur des Projektes beigetragen hat, hat sie auch grafisch die Behauptung von Brooks im Mythischen Arbeitsmonat demonstriert, dass das Hinzufügen des Personals zu einem Projekt darauf hinausläuft, länger nehmend, um zu vollenden; je mehr die Zahl von Gruppen eingeschlossen hat, desto mehr Zeit auf der Verwaltung und Kommunikation aber nicht wirklichen Forschung per se verbracht wird.

Das wirkliche Design des Projektes war ungewöhnlich, als MT-Projekte gehen. Ältere Systeme, wie SYSTRAN, waren mit der geringen Unterstützung schwer Wörterbuch-basiert, um Wortfolge umzuordnen. Neuere Systeme haben häufig an einer Probabilistic-Annäherung gearbeitet, die auf der parallelen Korpora gestützt ist. Eurotra hat die konstituierende Struktur des zu übersetzenden Textes gerichtet, zuerst eine syntaktische von einer zweiten Syntaxanalyse gefolgte Syntaxanalyse durchgehend, um eine Abhängigkeitsstruktur zu erzeugen, die von einer Endsyntaxanalyse mit einer dritten Grammatik gefolgt ist, um zu erzeugen, worauf innerlich als Intermediate Representation (IR) verwiesen wurde. Seitdem alle drei Module als Einleitungsprogramme durchgeführt wurden, würde es dann im Prinzip möglich sein, diese Struktur umgekehrt durch die entsprechenden Module für eine andere Sprache zu stellen, um einen übersetzten Text auf einigen der anderen Sprachen zu erzeugen. Jedoch in der Praxis war das nicht tatsächlich, wie Sprachpaare durchgeführt wurden.

Die erste "lebende" Übersetzung hat 4 Mb das Laufen von Microvax Ultrix und C-Prolog seit einem ganzen Wochenende eine Zeit Anfang 1987 besetzt. Der Satz, der aus dem Englisch ins Dänisch übersetzt ist, war "Japan macht Computer". Das durch das System gesehene Hauptproblem war die Generation von so genannten "Syntaxanalyse-Wäldern" - häufig eine Vielzahl von verschiedenen Grammatik-Regeln konnte auf jeden besonderen Ausdruck angewandt werden, Hunderte, sogar Tausende von (häufig identisch) Syntaxanalyse-Bäume erzeugend. Das hat riesige Mengen des Computerladens verbraucht, den ganzen Prozess unnötigerweise verlangsamend.

Während Eurotra nie ein "Arbeits"-MT-System geliefert hat, hat das Projekt einen weit reichenden langfristigen Einfluss auf die werdenden Sprachindustrien in europäischen Mitgliedstaaten, insbesondere unter den südlichen Ländern Griechenlands, Italiens, Spaniens und Portugals gemacht. Es gibt mindestens ein kommerzielles MT-System (entwickelt von einem akademischen/kommerziellen Konsortium in Dänemark) ist auf Technologie von Eurotra zurückzuführen gewesen.

Siehe auch

  • Apertium
  • Asien online-
  • Google übersetzen

Links


CEV / Zeitgenössische englische Version
Impressum & Datenschutz