Enhancements for Networked Music Performances
2018
The availability and capability of today’s internet allow several novel challenging interactive multimedia applications like Networked Music Performances (NMP). A Networked Music Performance is an online artistic collaboration with musicians located at different geographic locations connected using the internet. While offering manifold artistic possibilities, many technical challenges like the resulting latency and the possibility of packet loss have to be considered. This work depicts three enhancements for NMP applications which improve error robustness, the algorithmic delay, and the spatial listening experience, respectively.
To counteract the possibility of packet loss or network jitter-caused tardy
arrival of packets, this work derives two methods to conceal errors during
audio replay at the receiver side. The first, auto-regressive model-based
variant facilitates concealing the audible impact of missing packets with high
quality but is computationally expensive. Several ways of computing the
auto-regressive model are presented and compared. The second method,
based on wave-form substitution, constitutes an efficient, cheap alternative.
The proposed methods are evaluated subjectively with a listening test and
objectively with measurements of perceptual quality.
The application of audio codecs in NMP sessions is inevitable in most
scenarios due to the restricted data rate and in particular the upload rate
of private internet accesses. Besides reducing the data rate the codec must
feature a small algorithmic latency to restrict the overall latency to a certain
extent. A novel audio coding approach which features smaller delays than
widely used low-delay codecs and a clearly reduced data rate in contrast
to delay-less codecs is presented. It is constructed using the Adaptive Differential Pulse Code Modulation (ADPCM) codec approach in subbands in
combination with a Vector Quantizer (VQ) resulting in the Vector-Quantized
Adaptive Differential Pulse Code Modulation (VQ-ADPCM) codec. The proposed codec is capable of encoding broadband audio with a data rate of
64 kbit/s and algorithmic delay of about 1 ms. The perceptual quality is
compared to well-known codecs using perceptually motivated measurements.
The last contribution is intended to improve the acoustic spatial scenery
within a NMP. For this purpose, a pseudo stereo conversion method providing
a broad stereo panorama for single channel sound sources is derived. The
method enhances the spaciousness of the stereo mix at the receiver without
adding timbral coloration or reverberation and therefore offers an improved
listening experience for NMP participants. The proposed method is based on
the design of a complementary filter pair, which can be applied in time- and
frequency-domain. Additionally, the integration within a virtual surround
mixer based on Head-Related Impulse Responses (HRIRs) is demonstrated.
Virtual surround mixing allows the arbitrary positioning of several sound
sources in a virtual room. The extension with the proposed pseudo-stereo
approach even facilitates to define sound sources of a certain size instead of
single point sources.
The three proposed enhancements are purely based on digital signal processing and therefore can be implemented in the software layer of any NMP
system without demanding any changes to the actual musical performance,
the utilized hardware, or the available network structure.
Die weitreichende Verfugbarkeit und Leistungsfahigkeit des heutigen Internets erlaubt einige sowohl neuartige als auch herausfordernde interaktive
Multimediaanwendungen wie die sogenannte Networked Music Performance
(NMP). Eine NMP beschreibt eine kunstlerische Online-Kollaboration von
Musikern, die raumlich getrennt, aber durch das Internet verbunden sind.
Dieser Ansatz erlaubt vielfaltige kunstlerisch Moglichkeiten. Allerdings mussen auch viele technische Schwierigkeiten, wie die Ubertragungslatenz und die Moglichkeit von Paketverlusten, in Betracht gezogen werden. Diese Arbeit zeigt drei Erweiterungen fur NMP-Anwendungen auf, welche jeweils die Fehlerrobustheit, die Ubertragungslatenz und das raumliche Horerlebnis aufwerten.
Um der Moglichkeit eines Paketverlustes oder dem Netzwerk-Jitter-geschuldetem, verspatetem Eintreffen von Paketen entgegen zu wirken, werden
zunachst Methoden vorgestellt, die es erlauben Fehler in der Wiedergabe am
Empfanger zu verschleiern. Die erste Variante, basierend auf einem autoregressiven Modell, ermoglicht das Verbergen von horbaren Beeintrachtigungen durch fehlende Pakete bei hoher Qualitat, ist allerdings in der Berechnung sehr aufwendig. Mehrere Ansatze um autoregressive Signalmodelle zu ermitteln werden hierbei aufgezeigt und verglichen. Die zweite Methode,
basierend auf der Substitution von Wellenformen, stellt eine bezuglich des
Rechenaufwands gunstigere Alternative dar. Die Methoden werden mit Hilfe
eine Hortests subjektiv und durch Messungen der wahrgenommenen Qualitat
objektiv beurteilt.
Die Anwendung von Audiokompressionsverfahren in einer NMP-Session
ist in den meisten Szenarien unvermeidlich, da die Datenrate und insbesondere die Uploadrate von privaten Internetzugangen beschrankt ist. Neben der
Reduktion der Datenrate muss der verwendete Audio Codec eine moglichst
geringe Latenz aufweisen, um die Gesamtubertragungslatenz einzuschranken.
Ein neuartiger Audiokodierungsansatz, der geringere Latenzen als weit verbreitete Niedriglatenz-Codecs und dennoch kleinere Datenraten als latenzfreie Codecs aufweist, wird vorgestellt. Das Kompressionsverfahren basiert
auf der Anwendung der Adaptiven Differentiellen Pulse Code Modulation
(ADPCM) in Teilbandern. In Kombination mit einem Vektorquantisierer (VQ)
resultiert der Vektorquantisierte Adaptive Differentielle Pulse Code Modulation (VQ-ADPCM)-Codec. Der vorgestellte Codec ist imstande breitbandige
Audiosignale mit 64 kbit/s und einer algorithmischen Latenz von 1 ms zu
enkodieren. Die wahrgenommene Qualitat wird mit wohl-bekannten Codecs
anhand psychoakustisch-motivierter Messverfahren verglichen.
Der letzte Beitrag ist vorgesehen, die raumliche akustische Szenerie innerhalb einer NMP zu verbessern. Hierfur wird ein Pseudo-Stereo-Verfahren,
welches breite Stereopanoramen fur einkanalige Klangquellen liefert, hergeleitet.
Die Methode verbessert die Raumlichkeit des Stereomixes beim Empfanger
ohne das Nutzsignal zu verfarben oder zu verhallen. Dadurch wird dem
NMP-Nutzer ein verbessertes Horerlebnis geboten. Der vorgestellte Ansatz
basiert auf dem Entwurf eines komplementaren Filterpaares, welches in Zeit und Frequenzbereich angewendet werden kann. Zusatzlich ist die Integration
des Ansatzes in einem virtuellen Surround-Mischer basierend auf kopfbezogenen Impulsantworten (HRIR) veranschaulicht. Virtuelles Surround-Mischen erlaubt das beliebige Platzieren von Klangquellen in einem virtuellen Raum. Die Erweiterung mit der prasentierten Pseudo-Stereo-Methode ermoglicht
nun sogar das Platzieren von Quellen verschieden Grose anstatt von Punktquellen.
Die drei vorgestellten NMP-Verbesserungen basieren ausschlieslich auf
digitaler Signalverarbeitung und konnen deshalb in der Softwareschicht jeglichen
NMP-Systems realisiert werden, ohne dabei Adaptionen der musikalischen
Darbietung, der genutzten Hardware oder der verf¨ugbaren Netzwerkstruktur
zu erfordern.
Keywords:
- Correction
- Source
- Cite
- Save
- Machine Reading By IdeaReader
0
References
0
Citations
NaN
KQI