2014 & 2015
Zugl.: Aachen, Techn. Hochsch., Diss., 2014
Prüfungsjahr: 2014. - Publikationsjahr: 2015
Genehmigende Fakultät
Fak06
Hauptberichter/Gutachter
;
Tag der mündlichen Prüfung/Habilitation
2014-04-28
Online
URN: urn:nbn:de:hbz:82-rwth-2015-006647
URL: https://publications.rwth-aachen.de/record/462454/files/462454.pdf
URL: https://publications.rwth-aachen.de/record/462454/files/462454.pdf?subformat=pdfa
Einrichtungen
Inhaltliche Beschreibung (Schlagwörter)
Ingenieurwissenschaften (frei)
Thematische Einordnung (Klassifikation)
DDC: 620
Kurzfassung
Der Bedarf an hochqualitativen Audio- und Video-Diensten steigt rapide an. Beispiele hierfür sind audiovisuelle Konferenzsysteme oder Videospeicherung und -übertragung. Dafür sind effiziente Techniken für die Verbesserung und Kompression mehrkanaliger Audiosignale notwendig, wobei Kompatibilität zu Mono- oder Stereosystemen wünschenswert ist. In dieser Arbeit werden neuartige Signalverarbeitungsalgorithmen für Verbesserung und Kompression mehrkanaliger Audiosignale entwickelt und theoretische Leistungsgrenzen abgeleitet. Zusätzlich wird auch ein neues instrumentelles Qualitätsmaß für die Evaluation mehrkanaliger Signalverarbeitungsalgorithmen vorgeschlagen.Signalverbesserungsverfahren werden sowohl für die Aufnahme- als auch für die Wiedergabeseite eingeführt. Auf der Aufnahmeseite beinhaltet dies ein Beamformingsystem, das es auf der Basis einer numerischen Optimierung erlaubt, eine Zielrichtcharakteristik zu approximieren. Auf der Wiedergabeseite wird ein effizientes Postfilter vorgestellt, das zu einer erhöhten Sprachverständlichkeit führt.Der Hauptteil der Arbeit behandelt Systeme für die Kompression von Audiosignalen durch mehrkanalige lineare Prädiktion. Leistungsgrenzen der Systeme werden abgeleitet und zwei Methoden für eine adaptive Bitratenverteilung zwischen Intrakanal- und Interkanalprädiktion vorgestellt. Konzepte für den Einsatz von Rauschfärbung werden eingeführt und die Leistungsfähigkeit des kompletten Kompressionssystems wird durch instrumentelle Maße quantifiziert.Ein neues instrumentelles Qualitätsmaß für die Evaluation mehrkanaliger Signalverarbeitungsalgorithmen wird eingeführt. Es kombiniert das für einkanalige Systeme bewährte Qualitätsmaß PEAQ mit einem binauralen Gehörmodell und einem mathematischen Modell der kognitiven Verarbeitung. Die Integration der räumlichen Information in die Qualitätsbewertung führt zu einer konsistent hohen Korrelation zwischen dem Maß und einem Hörversuch.The demand for high definition audio and video services is rapidly increasing. Two representative examples for this are audio-visual conferencing or video storage and delivery. In this context, efficient techniques are required for enhancement and compression of multi channel audio signals with compatibility to, e.g., mono or stereo systems.In this thesis, novel signal processing algorithms for both enhancement and compression of multi channel signals are developed and theoretical performance bounds are derived. Additionally, a novel instrumental quality measure for the evaluation of multi channel signal processing algorithms is proposed. Enhancement schemes for both the recording and the reproduction side are introduced. This includes the optimization of a near field filter-and-sum beamformer to achieve a target directivity characteristic at the recording side. For the reproduction side, an efficient postfilter is presented which increases the speech intelligibility by taking the positive influence of early room reflections into account. The main part of this thesis covers multi channel predictive compression of audio signals. A predictive multi channel coding system is presented and analyzed. Performance bounds are derived and two methods for an adaptive bit rate distribution between inter channel and intra channel prediction are devised. Novel multi channel noise shaping concepts are introduced. The performance of the compression system is quantified by instrumental measures. A novel instrumental measure is introduced for the evaluation of multi channel signal enhancement and compression. It combines the proven single channel quality measure PEAQ with a binaural auditory model and a mathematical model of cognitive behavior, providing a reliable evaluation of quality perception and spatial fidelity. The inclusion of spatial information into the instrumental quality measurement leads to a consistently high correlation between the instrumental measure and a listening test.
OpenAccess:
PDF
PDF (PDFA)
(additional files)
Dokumenttyp
Dissertation / PhD Thesis/Report/Book
Format
online, print
Sprache
English
Externe Identnummern
HBZ: HT018606138
Interne Identnummern
RWTH-2015-00664
Datensatz-ID: 462454
Beteiligte Länder
Germany
|
The record appears in these collections: |