h1

h2

h3

h4

h5
h6
http://join2-wiki.gsi.de/foswiki/pub/Main/Artwork/join2_logo100x88.png

Adaptive algorithms for the identification of time-variant acoustic systems



VerantwortlichkeitsangabeStefan Kühl

ImpressumAachen : Shaker Verlag 2022

Umfang1 Online-Ressource : Illustrationen, Diagramme

ISBN978-3-8440-8633-1

ReiheAachen series on communication systems ; 1


Dissertation, RWTH Aachen University, 2022

Druckausgabe: 2022. - Auch veröffentlicht auf dem Publikationsserver der RWTH Aachen University


Genehmigende Fakultät
Fak06

Hauptberichter/Gutachter
;

Tag der mündlichen Prüfung/Habilitation
2022-03-07

Online
DOI: 10.18154/RWTH-2022-07587
URL: https://publications.rwth-aachen.de/record/850577/files/850577.pdf

Einrichtungen

  1. Lehrstuhl und Institut für Kommunikationssysteme (613310)

Inhaltliche Beschreibung (Schlagwörter)
acoustic echo cancellation (frei) ; system identification (frei) ; time-variant systems (frei)

Thematische Einordnung (Klassifikation)
DDC: 621.3

Kurzfassung
In vielen digitalen Sprach- und Audiokommunikationssystemen werden bei der Signalverarbeitung Modelle von akustischen Systemen verwendet. Oft müssen die Impulsantworten (IRs) dieser akustischen Systeme während oder vor der Nutzung eines Kommunikationssystems mit Hilfe von adaptiven Algorithmen identifiziert werden. Akustische Systeme beschreiben, wie Schall während der Übertragung zwischen einer Quelle und einem Empfänger beeinflusst wird. Beispiele für akustische Systeme sind Räume mit Reflexionen an Begrenzungen und Streuungen an Objekten, Kommunikationsgeräten wie Smartphones oder Smart-Home-Geräten oder auch der menschliche Kopf, bei dem Abschattungseffekte auftreten. In vielen Situationen müssen die IRs dieser Systeme identifiziert werden. Mögliche Szenarien sind akustische Messungen oder die Systemidentifizierung in Sprachkommunikationsanwendungen, z. B. für die akustische Echokompensation (AEC). Je nach Anwendungsfall müssen bestimmte Aspekte berücksichtigt werden. Für eine Messung kann das Anregungssignal entworfen werden, während für Sprachkommunikationsanwendungen die Systemidentifikation auf dem Kommunikationssignal beruht. Daher muss im letzteren Fall die Korrelation bei der Systemidentifikation berücksichtigt werden. Darüber hinaus können sich die zu identifizierenden Systeme im Laufe der Zeit verändern, wenn sich die akustische Umgebung ändert, z. B. durch bewegte Objekte, Luftbewegungen oder Temperaturänderungen. Daher müssen adaptive Algorithmen verwendet werden, um den Zustand des Systems zu verfolgen. Zusätzliche Herausforderungen ergeben sich, wenn mehrere Kanäle gleichzeitig identifiziert werden sollen. In dieser Arbeit werden die verschiedenen Aspekte der Systemidentifikation zeitvariabler akustischer Systeme für unterschiedliche Szenarien betrachtet. Sie bietet neue Einblicke in die Beziehung zwischen verschiedenen Systemidentifikationsalgorithmen und schlägt neue Konzepte und Algorithmen für spezifische Anwendungen vor. Messverfahren aus dem Bereich der Akustik und Tracking-Algorithmen aus dem Bereich der Kommunikation werden in einem gemeinsamen mathematischen Rahmen verglichen, der einen neuartigen Beweis ihrer mathematischen Äquivalenz für periodische Anregung liefert und so dazu beiträgt, die Lücke zwischen diesen beiden eng verwandten Gebieten zu schließen. Es wird gezeigt, dass das Anregungssignal hauptsächlich das Identifikationsverhalten bestimmt. Während bei zeitlich unveränderlichen Szenarien die erreichbare Qualität der Messung oft anhand des Signal-zu-Rausch-Verhältnisses (SNR) beurteilt wird, ist im zeitlich veränderlichen Fall auch das Nachführverhalten über die Zeit sehr wichtig. Daher werden verschiedene Anregungssignale entwickelt. Für Messungen werden häufig Sweep-Signale verwendet. Für Nachführalgorithmen werden Rauschsignale berücksichtigt, um eine gute Nachführleistung zu erreichen. Diese Arbeit gibt Einblicke in das Anpassungsverhalten über die Zeit in Abhängigkeit vom verwendeten Anregungssignal und stellt eine neue mehrkanalige Anregungsstrategie zur kontinuierlichen Systemidentifikation auf der Basis von exponentiellen Sweeps vor. Für AEC in Freisprechanlagen oder Telefonkonferenzen müssen akustische Systeme mit korrelierter Anregung identifiziert werden. Zu diesem Zweck wurden viele verschiedene Algorithmen entwickelt, z.B. der NLMS Algorithmus, der RLS Algorithmus und das Kalman-Filter. In dieser Arbeit wird gezeigt, wie diese Algorithmen als eingeschränkte Versionen eines allgemeinen Kalman-Filters abgeleitet werden können. Dies zeigt die enge Beziehung zwischen diesen Algorithmen und gibt neue Einblicke in ihre Funktionsweise. Für das Kalman-Filter im Zeitbereich wird eine neuartige Konvergenzanalyse durchgeführt, die zeigt, wie korrelierte Anregung die Anpassungsleistung beeinflusst. Für das Kalman-Filter im Frequenzbereich wird eine Dekorrelationsstufe entwickelt, die die Anpassungsleistung bei korrelierter Anregung verbessert. Es werden verschiedene Schätzmethoden für die im Kalman-Filter verwendeten a priori Informationen vorgestellt und die Abhängigkeit vom verwendeten Anpassungsalgorithmus aufgezeigt. Darüber hinaus bietet die gleichzeitige Erfassung mehrerer Kanäle eines akustischen Systems, um das gesamte Schallfeld zu erfassen, das Potenzial, ein natürlicheres Klangerlebnis zu bieten. Beim Umgang mit mehreren Kanälen ergeben sich zusätzliche Aspekte und Schwierigkeiten im Vergleich zur Identifizierung von nur einem Kanal, die in dieser Arbeit analysiert werden. Das Problem der Nicht-Eindeutigkeit, das mit mehreren korrelierten Kanälen einhergeht, wird analysiert und ein neuartiger Dekorrelationsansatz, der auf Techniken der primary ambient extraction basiert, wird in dieser Arbeit vorgeschlagen. Darüber hinaus wird ein komplexitätsreduzierter Algorithmus für räumliche Audiokommunikation vorgestellt, der auf einer spärlichen Aktivität von Schallquellen beruht. Bei vielen Anwendungen stehen neben dem Eingangs- und Ausgangssignal weitere Informationen zur Verfügung, die als A-priori-Informationen in den Filteranpassungsprozess einbezogen werden können. Beispiele für A-priori-Informationen in diesem Zusammenhang können zusätzliche Signale, Systemzustände und allgemeine Informationen über die jeweilige Anwendung sein, von denen der Identifikationsalgorithmus profitieren kann. In dieser Arbeit werden Methoden zur Nutzung von A-priori-Informationen für die Kombination von Beamformern und AEC sowie für die adaptive Rückkopplungsunterdrückung vorgeschlagen, wie sie für IP-basierte Telekonferenzen erforderlich ist.

Many digital speech and audio communication systems incorporate models of acoustic systems during signal processing. Often, the impulse responses (IRs) of these acoustic systems have to be identified during or before using a communication system by means of adaptive algorithms. Acoustic systems describe how sound is affected during transmission between a source and a receiver. Examples of acoustic systems comprise rooms with reflections from boundaries and scattering from objects, communication devices such as smartphones or smart home devices, or even a human head where shadowing effects occur. In many situations, the IRs of these systems need to be identified. Possible scenarios are acoustic measurements or system identification in speech communication applications, e.g., for acoustic echo cancellation (AEC). Depending on the specific use case, certain aspects have to be taken into account. For a measurement the excitation signal can be designed, whereas for speech communication applications the system identification relies on the communication signal. Hence, for the latter case, correlation has to be considered during the system identification. In addition, the systems to be identified may vary over time when the acoustic environment changes, e.g., due to moving objects, air movements, or temperature changes. Therefore, adaptive algorithms must be used to track the system’s state. Additional challenges arise when considering the identification of multiple channels simultaneously. This thesis considers the different aspects of system identification of time-variant acoustic systems for diverse scenarios. It provides new insights into the relationship of different system identification algorithms and proposes novel concepts and algorithms for specific applications. Measurement procedures from the field of acoustics and tracking algorithms from communication applications are compared in a joint mathematical framework, which contributes a novel proof of their mathematical equivalence for periodic excitation, thus helping to bridge the gap between these two closely related fields. It is shown that the excitation signal mainly determines the identification behavior. Whereas for time-invariant scenarios the achievable quality of the measurement is often assessed in terms of signal-to-noise ratio (SNR), in the time-variant case the tracking behavior over time is also very important. Therefore, different excitation signals are developed. Sweep signals are often used for measurements. For tracking algorithms, noise signals are considered to achieve good tracking performance. This thesis provides insights into the adaptation behavior over time in dependence on the excitation signal used and presents a new multi-channel excitation strategy for continuous system identification based on exponential sweeps. For AEC in hands-free calls or teleconferences, acoustic systems have to be tracked with correlated excitation. Many different algorithms have been developed for this purpose, e.g., the normalized least mean square algorithm, the recursive least squares algorithm, and the Kalman filter. In this thesis, it is shown how these algorithms can be derived as constrained versions of a general Kalman filter. This shows the close relationship between theses algorithms and provides new insights into their mode of operation. For the time-domain Kalman filter, a novel convergence analysis is carried out, showing how correlated excitation affects the adaptation performance. For the frequency-domain Kalman filter, a decorrelation stage is developed, which improves the adaptation performance for correlated excitation. Several estimation methods for a priori information employed in the Kalman filter are presented and the dependency on the specific adaptation algorithm used is shown. Furthermore, acquiring multiple channels of an acoustic system simultaneously in order to capture the full sound field offers the potential to provide a more natural sound experience. When dealing with multiple channels, additional aspects and difficulties compared to identifying only one channel arise, which are analyzed in this thesis. The non uniqueness problem concomitant with multiple correlated channels is analyzed and a novel decorrelation approach based on techniques from primary ambient extraction is proposed in this thesis. Moreover, a reduced-complexity algorithm for spatial audio communication is presented relying on a sparse activity of sound sources. For many applications, besides the input and output signal, further information is available which can be incorporated in the filter adaptation process as a priori information. Examples of a priori information in this context may include additional signals, system states, and general information about the application at hand that the identification algorithm can profit from. This thesis proposes methods to use a priori information for the combination of a beamformer and AEC and for adaptive feedback cancellation as required for IP based teleconferencing.

OpenAccess:
Download fulltext PDF
(additional files)

Dokumenttyp
Dissertation / PhD Thesis/Book

Format
online, print

Sprache
English

Externe Identnummern
HBZ: HT021461326

Interne Identnummern
RWTH-2022-07587
Datensatz-ID: 850577

Beteiligte Länder
Germany

 GO


OpenAccess

QR Code for this record

The record appears in these collections:
Document types > Theses > Ph.D. Theses
Document types > Books > Books
Faculty of Electrical Engineering and Information Technology (Fac.6)
Publication server / Open Access
Public records
Publications database
613310

 Record created 2022-08-02, last modified 2023-03-28


OpenAccess:
Download fulltext PDF
(additional files)
Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)