Gleitkommazahlen in digitaler Audioanwendung

Gleitkommazahlen in digitaler Audioanwendung finden sich in erster Linie als 32-bit- oder 64-bit-Gleitkommazahlen im Mastering, sowohl nativ auf der Rechner-CPU als auch ausgelagert auf dem DSP einer internen oder externen Soundkarte. Die meisten modernen HD-Recordingsysteme wie Nuendo, Logic, Samplitude, SADiE oder Pyramix arbeiten mit Gleitkommaarithmetik. Audioeditoren wie Adobe Audition oder Pro Tools ermöglichen zudem den Export von Audiodateien in 32 bit Gleitkommacodierung zum weiteren Mastering. Adobe Audition (in der aktuellen Version bei 64 bit Softwarearchitektur) arbeitet intern mit 32 bit Gleitkommaauflösung, so dass durch den Export und späteren Import von 32 bit Gleitkomma-kodierten Audiodateien kein weiteres Quantisierungsrauschen entsteht, welches sich bei jeder Umrechnung der Amplitudenauflösung erhöhen würde. Die Bit-Tiefe der Softwarearchitektur ist also unabhängig von der Bit-Tiefe der angewandten Gleitkommaarithmetik. Pro Tools hingegen (arbeitete bis Version 10 mit 48-bit-Festkommaarithmetik) sowie REAPER arbeiten in der aktuellen Version mit 64 bit Gleitkommazahlen.

Diese Bittiefe ist dabei in erster Linie für die Genauigkeit der Variablen innerhalb der Programmabarbeitung relevant, die dann zur weiteren Berechnung an die ALU bzw. die interne FPU der Rechner-CPU übergeben, dort auf deren Registergröße konvertiert, und beispielsweise von einem AMD Bulldozer mit 256 bit Genauigkeit berechnet werden. Schon die x87-Intel Coprozessoren aus den 80er Jahren rechneten Gleitkommazahlen IEEE-konform mit bis zu 80 bit extended. Erst am Ende der Berechnungen erfolgt die Rundung auf die Bittiefe der Software. Effekt-Plugins werden zur Entlastung der CPU oftmals, je nach Software- und Hardware-Konfiguration, von dem DSP einer internen Soundkarte oder sogar von externen DSP Servern berechnet.[1]

Während in Festkommaarithmetik der maximale Pegel 0 dBFS beträgt und eine weitere Erhöhung des Pegels zu einem Beschnitt der Amplitude und damit zu einem Clipping führt, ermöglicht die Gleitkommadarstellung einen Headroom. Der Dynamikbereich eines in Gleitkommazahlen dargestellten Audiosignals teilt sich also in zwei Bereiche 0 dBFS und 0 dBFS. Die maximale Auflösung hingegen ist durch die Mantisse der Gleitzahl beschränkt. Eine 32 bit Gleitkommaarithmetik nach IEEE 754 hat daher maximal 23 bit Auflösungsvermögen pro Halbwelle, mit Vorzeichenbit also 24 bit für den gesamten positiven und negativen Aussteuerungsbereich. Im Gegensatz hierzu löst eine Festkommaarithmetik mit 32 bit eine Halbwelle unter Abzug des Vorzeichenbits mit 31 bit auf, den gesamten positiven und negativen Aussteuerungsbereich also mit 32 bit. Erst eine 64 bit Gleitkommaarithmetik (double precision) ist mit ihrer 52 bit Mantisse einer 32 bit Festkommaarithmetik vollständig überlegen (also mit 53 bit Auflösungsvermögen einschließlich Vorzeichenbit für den gesamten positiven und negativen Aussteuerungsbereich).

Eine dezimale Festkommazahl kann immer durch mehrere Gleitzahlen dargestellt werden, die dezimale Zahl 0,375 beispielsweise durch die Gleitzahl · 0,375 (mit 0 als Exponent und 0,375 als Mantisse). Würde man die Mantisse m beispielsweise auf einen Bereich von 0,5 1 normalisieren, so ergäbe sich als Darstellung · 0,75. Die für den Audiobereich verbindliche Norm IEEE 754 sieht nun eine Normalisierung der Mantisse auf einen Bereich von vor, so dass sich der Wert 0,375 unverwechselbar mit der Gleitzahl · 1,5 darstellt.[2] Da die so normalisierte Mantisse immer eine 1 vor dem Komma hat, wird diese 1 in der binären Darstellung der Gleitzahl nicht mehr angeführt, sondern als hidden bit implizit definiert. Werte unterhalb des kleinsten mit normalisierter Mantisse darstellbaren Wertes werden nach IEEE 754 denormalisiert mit impliziter 0 vor der Mantisse dargestellt. Diese denormalisierten Gleitzahlen führen allerdings auf diversen FPUs bis zu einer 30-fachen Verlangsamung der Rechengeschwindigkeit[3] und finden schon deswegen im Audiobereich keine Anwendung, da dieser extreme Dynamikbereich unter −144 dBFS nicht nutzbar ist und vom kleinsten, im hörbaren Frequenzspektrum 20 kHz nutzbaren Audiosignal, dessen Größe vom Rauschpegel bestimmt wird, bei weitem überlagert wird.[4]

  1. SoundGrid Servers. Waves Inc., abgerufen am 22. Juni 2016 (englisch).
  2. Marcel Beuler: Realisierung von Arithmetik-Baugruppen für das 32-Bit-Gleitkommaformat der Norm ANSI/IEEE 754 mittels VHDL. (PDF; 548 kB) FH Gießen-Friedberg, April 2008, S. 3 (S. 7 der PDF), abgerufen am 28. Juni 2016.
  3. Jonas Ekeroot: Audio Software Development. (PDF; 630 kB) 9. August 2007, S. 26, abgerufen am 24. Juni 2016 (englisch).
  4. Uwe Martens: High Resolution Audio - Audio Analysis. 1. Juli 2015, abgerufen am 23. Juni 2016 (s. Zeile 8: Noise floor 32 bit Gleitkomma).

From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by Nelliwinne