h1

h2

h3

h4

h5
h6
000763198 001__ 763198
000763198 005__ 20251028095547.0
000763198 0247_ $$2HBZ$$aHT020113873
000763198 0247_ $$2Laufende Nummer$$a38268
000763198 0247_ $$2datacite_doi$$a10.18154/RWTH-2019-06141
000763198 037__ $$aRWTH-2019-06141
000763198 041__ $$aEnglish
000763198 082__ $$a004
000763198 1001_ $$0P:(DE-588)1189853639$$aHuck, Matthias$$b0$$urwth
000763198 245__ $$aStatistical models for hierarchical phrase-based machine translation$$cvorgelegt von Diplom-Informatiker Matthias Huck$$honline
000763198 246_3 $$aStatistische Modelle für die hierarchische phrasenbasierte maschinelle Übersetzung$$yGerman
000763198 260__ $$aAachen$$c2018
000763198 260__ $$c2019
000763198 300__ $$a1 Online-Ressource (ix, 142 Seiten) : Illustrationen
000763198 3367_ $$02$$2EndNote$$aThesis
000763198 3367_ $$0PUB:(DE-HGF)11$$2PUB:(DE-HGF)$$aDissertation / PhD Thesis$$bphd$$mphd
000763198 3367_ $$2BibTeX$$aPHDTHESIS
000763198 3367_ $$2DRIVER$$adoctoralThesis
000763198 3367_ $$2DataCite$$aOutput Types/Dissertation
000763198 3367_ $$2ORCID$$aDISSERTATION
000763198 500__ $$aVeröffentlicht auf dem Publikationsserver der RWTH Aachen University 2019
000763198 502__ $$aDissertation, RWTH Aachen University, 2018$$bDissertation$$cRWTH Aachen University$$d2018$$gFak01$$o2018-08-01
000763198 5203_ $$aMaschinelle Übersetzungssysteme übersetzen Texte automatisch aus einer natürlichen Sprache in eine andere. Der dominierende Ansatz zur maschinellen Übersetzung war für viele Jahre die phrasenbasierte statistische maschinelle Übersetzung. In der statistischen maschinellen Übersetzung werden probabilistische Modelle aus Trainingsdatengelernt, und ein Dekoder führt eine Suche durch, um basierend auf den Modellbewertungen die beste Übersetzung eines Eingabesatzes zu bestimmen. Phrasenbasierte Systeme stützen sich auf elementare Übersetzungseinheiten, die aus zusammenhängenden bilingualen Sequenzen von Wörtern bestehen, sogenannten Phrasen. Der hierarchische Ansatz zur statistischen maschinellen Übersetzung erlaubt Phrasen mit Lücken. Formal kann das hierarchische Phraseninventar als eine synchrone kontextfreie Grammatik repräsentiert werden, die aus bilingualem Text induziert wird, und das hierarchische Dekodieren kann mit einer parsingbasierten Prozedur durchgeführt werden. Das Paradigma der hierarchischen phrasenbasierten maschinellen Übersetzung ermöglicht eine konsistente Art und Weise der Modellierung von Umordnungen und Abhängigkeiten über weite Distanzen. Die üblichen statistischen Modelle, die die hierarchische Suche leiten, sind recht ähnlich zu denjenigen, die in der konventionellen phrasenbasierten Übersetzung eingesetzt werden. In der vorliegenden Arbeit werden neuartige Erweiterungen der hierarchischen phrasenbasierten maschinellen Übersetzung mit statistischen Modellen entwickelt, mit einem Hauptaugenmerk auf Methoden, für die keinerlei syntaktische Annotation der Daten erforderlich ist. Es werden im Einzelnen Verbesserungen hierarchischer Systeme mittels erweiterter lexikalischer Modelle erforscht, welche den gesamten Quellsatz als Kontext berücksichtigen. Es werden verschiedene Varianten der lexikalischen Glättung untersucht. Umordnungserweiterungen und ein Modell der Phrasenorientierung für die hierarchische Übersetzung werden eingeführt. Modelle der Worteinfügung und -löschung werden präsentiert. Techniken zum Training hierarchischer Übersetzungssysteme mit Hilfe zusätzlicher synthetischer Daten werden vorgestellt. Und eine Trainingsmethode wird vorgeschlagen, die zusätzliche synthetische Daten verwendet, welche ausgehend von einer Zwischensprache erzeugt wurden. Die Nützlichkeit der Erweiterungen zur Verbesserung der Übersetzungsqualität wird anhand empirischer Evaluation an mehreren Sprachpaaren verifiziert, darunter Arabisch→Englisch, Chinesisch→Englisch, Französisch→Deutsch, Englisch→Französisch und Deutsch→Französisch.$$lger
000763198 520__ $$aMachine translation systems automatically translate texts from one natural language to another. The dominant approach to machine translation has been phrase-based statistical machine translation for many years. In statistical machine translation, probabilistic models are learned from training data, and a decoder is conducting a search to determine the best translation of an input sentence based on model scores. Phrase-based systems rely on elementary translation units that are continuous bilingual sequences of words, called phrases. The hierarchical approach to statistical machine translation allows for phrases with gaps. Formally, the hierarchical phrase inventory can be represented as a synchronous context-free grammar that is induced from bilingual text, and hierarchical decoding can be carried out with a parsing-based procedure. The hierarchical phrase-based machine translation paradigm enables modeling of reorderings and long-distance dependencies in a consistent way. The typical statistical models that guide hierarchical search are fairly similar to those employed in conventional phrase-based translation. In this work, novel extensions with statistical models for hierarchical phrase-based machine translation are developed, with a focus on methods that do not require any syntactic annotation of the data. Specifically, enhancements of hierarchical systems with extended lexicon models that take global source sentence context into account are investigated; various lexical smoothing variants are examined; reordering extensions and a phrase orientation model for hierarchical translation are introduced; word insertion and deletion models are presented; techniques for training of hierarchical translation systems with additional synthetic data are suggested; and a training method is proposed that utilizes additional synthetic data which is created via a pivot language. The beneficial impact of the extensions on translation quality is verified by means of empirical evaluation on various language pairs, including Arabic→English, Chinese→English, French→German, English→French, and German→French.$$leng
000763198 588__ $$aDataset connected to Lobid/HBZ
000763198 591__ $$aGermany
000763198 653_7 $$acomputational linguistics
000763198 653_7 $$amachine translation
000763198 653_7 $$anatural language processing
000763198 7001_ $$0P:(DE-82)IDM01519$$aNey, Hermann$$b1$$eThesis advisor$$urwth
000763198 7001_ $$aFraser, Alexander M.$$b2$$eThesis advisor
000763198 8564_ $$uhttps://publications.rwth-aachen.de/record/763198/files/763198.pdf$$yOpenAccess
000763198 8564_ $$uhttps://publications.rwth-aachen.de/record/763198/files/763198_source.zip$$yRestricted
000763198 8564_ $$uhttps://publications.rwth-aachen.de/record/763198/files/763198.gif?subformat=icon$$xicon$$yOpenAccess
000763198 8564_ $$uhttps://publications.rwth-aachen.de/record/763198/files/763198.jpg?subformat=icon-1440$$xicon-1440$$yOpenAccess
000763198 8564_ $$uhttps://publications.rwth-aachen.de/record/763198/files/763198.jpg?subformat=icon-180$$xicon-180$$yOpenAccess
000763198 8564_ $$uhttps://publications.rwth-aachen.de/record/763198/files/763198.jpg?subformat=icon-640$$xicon-640$$yOpenAccess
000763198 8564_ $$uhttps://publications.rwth-aachen.de/record/763198/files/763198.jpg?subformat=icon-700$$xicon-700$$yOpenAccess
000763198 909CO $$ooai:publications.rwth-aachen.de:763198$$pdnbdelivery$$pdriver$$pVDB$$popen_access$$popenaire
000763198 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-588)1189853639$$aRWTH Aachen$$b0$$kRWTH
000763198 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-82)IDM01519$$aRWTH Aachen$$b1$$kRWTH
000763198 9141_ $$y2019
000763198 915__ $$0StatID:(DE-HGF)0510$$2StatID$$aOpenAccess
000763198 9201_ $$0I:(DE-82)122010_20140620$$k122010$$lLehrstuhl für Informatik 6 (Sprachverarbeitung und Mustererkennung)$$x0
000763198 9201_ $$0I:(DE-82)120000_20140620$$k120000$$lFachgruppe Informatik$$x1
000763198 961__ $$c2019-07-08T11:15:06.030703$$x2019-06-25T19:01:23.159009$$z2019-07-08T11:15:06.030703
000763198 9801_ $$aFullTexts
000763198 980__ $$aI:(DE-82)120000_20140620
000763198 980__ $$aI:(DE-82)122010_20140620
000763198 980__ $$aUNRESTRICTED
000763198 980__ $$aVDB
000763198 980__ $$aphd