Beispiel-basierte maschinelle Übersetzung

Die Annäherung der Beispiel-basierten maschinellen Übersetzung (EBMT) an die maschinelle Übersetzung wird häufig durch seinen Gebrauch eines zweisprachigen Korpus mit parallelen Texten als seine Hauptkenntnisse-Basis an der Durchlaufzeit charakterisiert. Es ist im Wesentlichen eine Übersetzung analog und kann als eine Durchführung der Fall-basierten vernünftig urteilenden Annäherung des Maschinenlernens angesehen werden.

Am Fundament der Beispiel-basierten maschinellen Übersetzung ist die Idee von der Übersetzung analog. Wenn angewandt, auf den Prozess der menschlichen Übersetzung ist die Idee, dass Übersetzung analog stattfindet, eine Verwerfung der Idee, dass Leute Sätze übersetzen, indem sie tief Sprachanalyse tun. Stattdessen wird es auf dem Glauben gegründet, dass Leute erstens übersetzen, indem sie einen Satz in bestimmte Ausdrücke dann zersetzen, indem sie diese Ausdrücke, und schließlich übersetzen, indem sie diese Bruchstücke in einen langen Satz richtig zusammensetzen. Übersetzungen von Phrasal werden analog zu vorherigen Übersetzungen übersetzt. Der Grundsatz der Übersetzung wird analog zur Beispiel-basierten maschinellen Übersetzung durch die Beispiel-Übersetzungen verschlüsselt, die verwendet werden, um solch ein System zu erziehen.

Beispiel-basierte Systeme der maschinellen Übersetzung werden von der zweisprachigen parallelen Korpora erzogen, die Satz-Paare wie das im Tisch gezeigte Beispiel enthalten. Satz-Paare enthalten Sätze auf einer Sprache mit ihren Übersetzungen in einen anderen. Das besondere Beispiel zeigt ein Beispiel eines Minimalpaars, bedeutend, dass sich die Sätze durch gerade ein Element ändern. Diese Sätze machen es einfach, Übersetzungen von subsentential Einheiten zu erfahren. Zum Beispiel würde ein Beispiel-basiertes System der maschinellen Übersetzung drei Einheiten der Übersetzung erfahren:

  1. Wie viel ist das X? entspricht Ano 'X wa ikura desu ka.
  1. roter Regenschirm entspricht akai kasa
  1. kleine Kamera entspricht chiisai kamera

Das Bestehen dieser Einheiten kann verwendet werden, um neuartige Übersetzungen in der Zukunft zu erzeugen. Zum Beispiel, wenn wir mit einem Text erzogen worden sind, der die Sätze enthält:

Präsident Kennedy wurde während der Parade erschossen. und Der Verurteilte ist am 15. Juli geflüchtet. Wir konnten den Satz übersetzen Der Verurteilte wurde während der Parade erschossen. durch das Ersetzen der passenden Teile der Sätze.

Andere Annäherungen an die maschinelle Übersetzung, einschließlich der statistischen maschinellen Übersetzung, verwenden auch zweisprachige Korpora, um den Übersetzungsprozess zu erfahren.

Beispiel hat maschinelle Übersetzung gestützt wurde zuerst von Makoto Nagao 1984 angedeutet. Es hat bald die Aufmerksamkeit von Wissenschaftlern im Feld der Verarbeitung der natürlichen Sprache angezogen.

EBMT wird am besten für Subsprachphänomene wie mehrgliedrige Verben angepasst.

Mehrgliedrige Verben haben hoch kontextabhängige Bedeutungen. Mehrgliedrige Verben sind eine allgemein vorkommende Eigenschaft in Englisch und umfassen ein Verb, das von einem Adverb und/oder einem Verhältniswort gefolgt ist. Das Adverb (Ien)/Verhältniswort wird als die Partikel zum Verb genannt. Mehrgliedrige Verben erzeugen spezialisierte mit dem Zusammenhang spezifische Bedeutungen, die aus der Bedeutung der Bestandteile nicht abgeleitet werden dürfen. Es gibt fast immer eine Zweideutigkeit während der Wort-zu-Wort-Übersetzung aus der Quelle in die Zielsprache.

Als ein Beispiel, lassen Sie uns das mehrgliedrige Verb denken: angezogen und seine Hindi-Bedeutung. Es kann auf einige der folgenden Weisen verwendet werden:

Ram hat die Lichter angezogen. (Eingeschaltet) (Jalana)

Ram hat eine Kappe angezogen. (Tragen) (Pahenna)

EBMT kann verwendet werden, um den Zusammenhang des Satzes zu bestimmen.

Siehe auch

Links

  • Cunei - eine offene Quellplattform für die datengesteuerte maschinelle Übersetzung, die aus der Forschung in EBMT gewachsen ist, sondern auch neue Fortschritte vom SMT Feld einschließt
  • Marclator - ein free/open-source Anschreiber-gesteuertes Beispiel-basiertes System der maschinellen Übersetzung, das auf der Anschreiber-Hypothese gestützt ist
  • Yeminli Sözlük - Ein Englisch - türkisches Korpus/Wörterbuch von Millionen von vorübersetzten Sätzen

Talcott Pfarrer / Gotische Architektur
Impressum & Datenschutz