2025
Dissertation, RWTH Aachen University, 2024
Genehmigende Fakultät
Fak06
Hauptberichter/Gutachter
;
Tag der mündlichen Prüfung/Habilitation
2024-11-18
Einrichtungen
Projekte
Inhaltliche Beschreibung (Schlagwörter)
binaural audio (frei) ; binaural cue adaptation (frei) ; spatial audio (frei) ; virtual reality (frei)
Thematische Einordnung (Klassifikation)
DDC: 621.3
Kurzfassung
Unter einer binauralen Wiedergabe versteht man die Wiedergabe geeigneter Audiosignale an den beiden Ohren eines Zuhörers. Damit der Zuhörer Schallquellen ortsstabil in der Umgebung wahrnimmt, müssen zu den Bewegungen des Zuhörers passende Signale erzeugt und wiedergegeben werden. Dies wird als interaktive binaurale Wiedergabe bezeichnet. Ziel dieser Arbeit ist eine interaktive binaurale Wiedergabe ausgehend von zwei Ohrsignalen, die zunächst nur für eine nicht-interaktive binaurale Wiedergabe bzw. einen unbewegten Zuhörer geeignet sind. Dieses Ziel ist aus zwei Gründen interessant: einerseits ermöglicht es dem Zuhörer eine größere Immersion, wenn binaurale Aufzeichnungstechnik genutzt wird. Dies ermöglicht Aufnahme und Übertragung von immersiven, räumlichen Audiosignalen auch mit vergleichsweise geringem technischem Aufwand. Andererseits können die vorgeschlagenen Verfahren direkt in Kopfhörern eingesetzt werden. Dort interagieren sie nahtlos mit etablierten Techniken und ermöglichen eine interaktive Wiedergabe ohne Änderungen an bestehenden Wiedergabegeräten, Übertragungswegen oder Medienplattformen. Daher wäre, anders als mit Ansätzen nach dem bisherigen Stand der Technik, die Verbreitung und Vermarktung entsprechender Kopfhörer ohne Koordination des Kopfhörerherstellers mit anderen Marktakteuren möglich. Der vorgestellte Ansatz wird mit einem Hörversuch validiert. Dazu wurden an den Ohren der Versuchspersonen akustische Szenen mit Sprachsignalen aus Lautsprechern binaural aufgezeichnet. Diese Aufzeichnungen wurden anschließend über Kopfhörer und einen Echtzeit-Prototyp mit Head-Tracking interaktiv wiedergegeben. Aufgabe der Versuchspersonen war die Unterscheidung dieser Kopfhörerwiedergabe von der Lautsprecherwiedergabe in einem indirekten Vergleich. Diese Unterscheidung fiel selbst erfahrenen Versuchspersonen schwer, was darauf hindeutet, dass der Prototyp eine natürliche und plausible Hörerfahrung ermöglicht.Binaural reproduction refers to the reproduction of certain audio signals at the two ears of the listener. For a moving listener to perceive sound sources as fixed in the environment, the reproduced signals need to match the listener’s movements. Interactive binaural reproduction with head tracking aims to generate such signals. The goal of this thesis is to achieve interactive binaural reproduction based on binaurally recorded signals, that is, on two ear signals originally intended for non-interactive binaural reproduction for a non-moving listener. This is desirable for two major reasons. The resulting algorithms enable a more immersive experience of binaural recordings, which is of interest in applications where greater technical effort for recording may not be feasible. Furthermore, the algorithms can be integrated into headphones. There, they seamlessly interoperate with established technologies, such that existing media devices and distribution platforms do not need to be modified. This eliminates the coordination and standardization efforts that would be required to make state-of-the-art methods widely usable, and potentially facilitates a broad market introduction. A listening experiment validates the proposed approach. Acoustic scenes with speech sources were binaurally recorded at the ears of human subjects. A real-time prototype with head tracking provided interactive binaural reproduction of these recordings via headphones. Subjects were asked to distinguish, in an indirect comparison, the artificial binaural reproduction from reality (ground-truth signals emitted by the loudspeakers in the same room). Results show that this task was difficult even for expert listeners, indicating that the prototype provides a natural and plausible listening experience.
Dokumenttyp
Dissertation / PhD Thesis/Book
Format
print
Sprache
English
Externe Identnummern
HBZ: HT030937408
Interne Identnummern
RWTH-2025-00660
Datensatz-ID: 1002746
Beteiligte Länder
Germany
![]() |
The record appears in these collections: |