h1

h2

h3

h4

h5
h6
http://join2-wiki.gsi.de/foswiki/pub/Main/Artwork/join2_logo100x88.png

Phase-Aware spectral speech enhancement using deep learning techniques



VerantwortlichkeitsangabeLars-Hendrik Thieling

ImpressumAachen : Shaker Verlag 2025

Umfangx, 173 Seiten : Illustrationen

ISBN978-3-8191-0312-4, 9783819103124

ReiheAachen series on communication systems ; 7


Dissertation, Rheinisch-Westfälische Technische Hochschule Aachen, 2025

Druckausgabe: 2025. - Zweitveröffentlicht auf dem Publikationsserver der RWTH Aachen University 2026


Genehmigende Fakultät
Fak06

Hauptberichter/Gutachter
;

Tag der mündlichen Prüfung/Habilitation
2025-05-08

Online
DOI: 10.18154/RWTH-2025-09844
URL: http://publications.rwth-aachen.de/record/1022044/files/1022044_ZV.pdf

Einrichtungen

  1. Lehrstuhl und Institut für Kommunikationssysteme (613310)

Inhaltliche Beschreibung (Schlagwörter)
deep learning (frei) ; phase estimation (frei) ; speech enhancement (frei)

Thematische Einordnung (Klassifikation)
DDC: 621.3

Kurzfassung
Im Alltag ist Sprache häufig Hintergrundgeräuschen, Nachhall, Echo oder Paketverlusten ausgesetzt. Diese Störungen beeinträchtigen die Qualität und Verständlichkeit der Sprache und erschweren somit die Kommunikation. Sprachverbesserungsansätze zielen darauf ab, die negativen Auswirkungen dieser Störungen zu verringern, indem sie die wahrgenommene Qualität und Klarheit der Sprache verbessern. Diese Dissertation befasst sich mit dem aufstrebenden Gebiet der phasenbewussten Sprachverbesserung, die herkömmliche amplitudenbasierte Methoden durch die zusätzliche Verarbeitung des oft vernachlässigten Phasenspektrums erweitert. Es werden neuartige Konzepte für Deep-Learning-basierte Ansätze vorgeschlagen und evaluiert, wobei ein besonderer Schwerpunkt auf der Phasenschätzung und ihrer Integration in die Sprachverbesserung liegt. Neben theoretischen Untersuchungen, die das Potenzial der Phasenverarbeitung hervorheben, werden Methoden zur Phasenschätzung mit tiefen neuronalen Netzen vorgestellt und Strategien zur gemeinsamen Optimierung der Amplituden- und Phasenschätzung vorgeschlagen. Objektive Bewertungsmaße und subjektive Hörversuche bestätigen die Wirksamkeit der vorgeschlagenen Ansätze und unterstreichen ihre Relevanz für die nächste Generation von Sprachverbesserungssystemen.

In everyday environments, speech is often degraded by background noise, reverberation, echo, or transmission losses. These distortions reduce quality and intelligibility, impairing communication. Speech enhancement techniques aim to overcome these challenges by improving the perceptual quality and clarity of speech under adverse conditions. This dissertation advances the emerging field of phase-aware speech enhancement, which extends conventional magnitude-based methods by also processing the often-overlooked phase spectrum. Novel concepts for deep learning-based approaches are proposed and evaluated, with a particular focus on phase estimation and its integration into speech enhancement. Beyond theoretical investigations that highlight the potential of phase processing, methods for estimating the phase with deep neural networks are introduced, and strategies for jointly optimizing magnitude and phase estimation are proposed. Objective measures and subjective listening experiments confirm the effectiveness of the proposed approaches, underlining their relevance for the next generation of speech enhancement systems.

OpenAccess:
Volltext herunterladen PDF

Dokumenttyp
Dissertation / PhD Thesis/Book

Format
online, print

Sprache
English

Externe Identnummern
HBZ: HT031364748

Interne Identnummern
RWTH-2025-09844
Datensatz-ID: 1022044

Beteiligte Länder
Germany

 GO


OpenAccess

QR Code for this record

The record appears in these collections:
Dokumenttypen > Qualifikationsschriften > Dissertationen
Dokumenttypen > Bücher > Bücher
Fakultät für Elektrotechnik und Informationstechnik (Fak.6)
Publikationsserver / Open Access
Öffentliche Einträge
Publikationsdatenbank
613310

 Datensatz erzeugt am 2025-11-19, letzte Änderung am 2026-01-12


OpenAccess:
Volltext herunterladen PDF
Dieses Dokument bewerten:

Rate this document:
1
2
3
 
(Bisher nicht rezensiert)