Article

Kompression des Latent Spaces binauraler Sprachverbesserungsalgorithmen mit geringer Komplexität und ohne algorithmische Latenz (de)

* Presenting author
Abstract: Binaurale Signalverarbeitung kann das Sprachverstehen von Trägern von Cochlea-Implantaten und anderen Hörhilfen in komplexen akustischen Szenarien verbessern. Ein neuer Ansatz hierbei ist der Austausch latenter Daten zwischen ansonsten unabhängig arbeitenden Algorithmen der Signalprozessoren des linken bzw. rechten Ohres. Dieser Ansatz hat eine Verbesserung der Gesamtleistungsfähigkeit der Sprachverbesserung gezeigt. Für eine praktische Anwendung müssen diese latenten Daten zwischen den Ohren drahtlos übertragen werden, sodass eine Reduktion dieser zu übertragenden Datenmenge zwecks Reduktion der Leistungsaufnahme mit minimaler Latenz wünschenswert ist.In dieser Arbeit wird ein generisches Verfahren zur latenzfreien Kompression dieser latenten Daten vorgestellt, welches zudem eine geringe zusätzliche Komplexität aufweist. Mittels Projektion der latenten Daten auf einen Unterraum und nachfolgender Kompression durch vektorquantisierter Rückkopplungsautoencoder kann die Datenrate ohne nennenswerten Leistungsverlust um mindestens 50 % im Vergleich zu direkter Vektorquantisierung reduziert werden. Die Zahl der Modellparameter steigt dabei durch den Kompressionsansatz um weniger als 4 %. Hyperparameteroptimierung und Optimierung der Gesamtstruktur inklusive Quantisierer können die Datenrate weiter verbessern.