h1

h2

h3

h4

h5
h6
http://join2-wiki.gsi.de/foswiki/pub/Main/Artwork/join2_logo100x88.png

Multi-channel audio-processing : enhancement, compression and evaluation of quality = Mehrkanalige Audiosignalverarbeitung : Verbesserung, Codierung und Qualitätsbewertung



VerantwortlichkeitsangabeMagnus Schäfer

Ausgabe1. Aufl.

ImpressumAachen : Mainz 2014

UmfangX, 156 S. : graph. Darst.

ISBN978-3-95886-007-0

ReiheAachener Beiträge zu Digitalen Nachrichtensystemen ; 39


Zugl.: Aachen, Techn. Hochsch., Diss., 2014

Prüfungsjahr: 2014. - Publikationsjahr: 2015


Genehmigende Fakultät
Fak06

Hauptberichter/Gutachter
;

Tag der mündlichen Prüfung/Habilitation
2014-04-28

Online
URN: urn:nbn:de:hbz:82-rwth-2015-006647
URL: https://publications.rwth-aachen.de/record/462454/files/462454.pdf
URL: https://publications.rwth-aachen.de/record/462454/files/462454.pdf?subformat=pdfa

Einrichtungen

  1. Lehrstuhl und Institut für Nachrichtengeräte und Datenverarbeitung (613310)

Inhaltliche Beschreibung (Schlagwörter)
Ingenieurwissenschaften (frei)

Thematische Einordnung (Klassifikation)
DDC: 620

Kurzfassung
Der Bedarf an hochqualitativen Audio- und Video-Diensten steigt rapide an. Beispiele hierfür sind audiovisuelle Konferenzsysteme oder Videospeicherung und -übertragung. Dafür sind effiziente Techniken für die Verbesserung und Kompression mehrkanaliger Audiosignale notwendig, wobei Kompatibilität zu Mono- oder Stereosystemen wünschenswert ist. In dieser Arbeit werden neuartige Signalverarbeitungsalgorithmen für Verbesserung und Kompression mehrkanaliger Audiosignale entwickelt und theoretische Leistungsgrenzen abgeleitet. Zusätzlich wird auch ein neues instrumentelles Qualitätsmaß für die Evaluation mehrkanaliger Signalverarbeitungsalgorithmen vorgeschlagen.Signalverbesserungsverfahren werden sowohl für die Aufnahme- als auch für die Wiedergabeseite eingeführt. Auf der Aufnahmeseite beinhaltet dies ein Beamformingsystem, das es auf der Basis einer numerischen Optimierung erlaubt, eine Zielrichtcharakteristik zu approximieren. Auf der Wiedergabeseite wird ein effizientes Postfilter vorgestellt, das zu einer erhöhten Sprachverständlichkeit führt.Der Hauptteil der Arbeit behandelt Systeme für die Kompression von Audiosignalen durch mehrkanalige lineare Prädiktion. Leistungsgrenzen der Systeme werden abgeleitet und zwei Methoden für eine adaptive Bitratenverteilung zwischen Intrakanal- und Interkanalprädiktion vorgestellt. Konzepte für den Einsatz von Rauschfärbung werden eingeführt und die Leistungsfähigkeit des kompletten Kompressionssystems wird durch instrumentelle Maße quantifiziert.Ein neues instrumentelles Qualitätsmaß für die Evaluation mehrkanaliger Signalverarbeitungsalgorithmen wird eingeführt. Es kombiniert das für einkanalige Systeme bewährte Qualitätsmaß PEAQ mit einem binauralen Gehörmodell und einem mathematischen Modell der kognitiven Verarbeitung. Die Integration der räumlichen Information in die Qualitätsbewertung führt zu einer konsistent hohen Korrelation zwischen dem Maß und einem Hörversuch.

The demand for high definition audio and video services is rapidly increasing. Two representative examples for this are audio-visual conferencing or video storage and delivery. In this context, efficient techniques are required for enhancement and compression of multi channel audio signals with compatibility to, e.g., mono or stereo systems.In this thesis, novel signal processing algorithms for both enhancement and compression of multi channel signals are developed and theoretical performance bounds are derived. Additionally, a novel instrumental quality measure for the evaluation of multi channel signal processing algorithms is proposed. Enhancement schemes for both the recording and the reproduction side are introduced. This includes the optimization of a near field filter-and-sum beamformer to achieve a target directivity characteristic at the recording side. For the reproduction side, an efficient postfilter is presented which increases the speech intelligibility by taking the positive influence of early room reflections into account. The main part of this thesis covers multi channel predictive compression of audio signals. A predictive multi channel coding system is presented and analyzed. Performance bounds are derived and two methods for an adaptive bit rate distribution between inter channel and intra channel prediction are devised. Novel multi channel noise shaping concepts are introduced. The performance of the compression system is quantified by instrumental measures. A novel instrumental measure is introduced for the evaluation of multi channel signal enhancement and compression. It combines the proven single channel quality measure PEAQ with a binaural auditory model and a mathematical model of cognitive behavior, providing a reliable evaluation of quality perception and spatial fidelity. The inclusion of spatial information into the instrumental quality measurement leads to a consistently high correlation between the instrumental measure and a listening test.

OpenAccess:
Download fulltext PDF Download fulltext PDF (PDFA)
(additional files)

Dokumenttyp
Dissertation / PhD Thesis/Report/Book

Format
online, print

Sprache
English

Externe Identnummern
HBZ: HT018606138

Interne Identnummern
RWTH-2015-00664
Datensatz-ID: 462454

Beteiligte Länder
Germany

 GO


OpenAccess

QR Code for this record

The record appears in these collections:
Document types > Theses > Ph.D. Theses
Document types > Reports > Reports
Document types > Books > Books
Faculty of Electrical Engineering and Information Technology (Fac.6)
Publication server / Open Access
Public records
Publications database
613310

 Record created 2015-02-06, last modified 2025-09-30