High Resolution, Hi-Fi, lossless, CD-Qualität, Hi-Res – da wird doch der Hund in der Pfanne verrückt! Wie soll man sich als nicht gerade Technik-affiner, stets nach modernster Unterhaltungselektronik lechzender Durchschnittsbürger in so einem verkabelten oder drahtlosem Audio-Verhau zurechtzufinden?

Ich glaube, dass sich die wenigsten unserer Leser an den Schwarzweiß-Blockbuster „Die Feuerzangenbowle“ mit Heinz Rühmann in der Hauptrolle erinnern können. Obgleich es in dieser UFA Komödie eine Schlüsselszene gibt, in der ein in Würde gealteter Professor den Schülern auf famose Weise die Funktionsweise einer Dampfmaschine erläutern will.

Dumm stellen hilft

Was Daniela Katzenberger, ähm, berühmt machte, war ihr Spruch „sei schlau, stell dich dumm“. Jahrzehnte zuvor wandte der auf Zelluloid gebannte Pädagoge die gleiche Taktik an, indem er die ganze Klasse fragte „wat is en Dampfmaschin?“ (der Herr sprach Dialekt) und folgenden Rat direkt anhängte: „nun, da stellen wir uns erstmal janz dumm“!

Ich glaube, das ist ein guter Ansatz um das Thema Streaming, Streamer und Streaming-Formate einigermaßen volksnah aufzudröseln. Und ich beichte gleich vorweg, dass ich mich vor allem bei fairaudio.de und Qobuz „schlau machte“. Nun denn, legen wir los:

Die Vibration einer Flüssigkeit

Ein Ton ist nach Qobuz-Definition die wellenhafte Vibration einer Flüssigkeit, die vom menschlichen Ohr wahrgenommen wird. In diesem natürlichen analogen Zustand hören wir seit Anbeginn der Zeit individuell gut oder schlecht. Nach der Erfindung der Dampfmaschine gelang es, diesen Sound durch Erfassung und Wiedergabe zu konservieren.

Dann ist sehr viel Wasser die Donau hinab geflossen, bis das Zeitalter der Informatik und der digitalen Welt die Art des Erfassens und Wiedergebens revolutionierte. Wir wollen einen Zeitsprung nachvollziehen. Machen Sie sich bitte bereit zum Beamen: Jetzt!

Verlustbehaftet aber sehr beliebt

Die MP3 ist eine komprimierte, verlustbehaftete Audio-Datei, die Mitte der 1990er-Jahre eingeführt wurde. Sie enthält weniger Informationen als die Original-Datei. Der Komprimierungsprozess geht mit dem Verlust zahlreicher Audio-Informationen einher, vor allem die höchsten Töne werden förmlich abrasiert. „MP3“ ist die Abkürzung für „MPEG-1 Layer 3„.

Bei einer MP3-Datei handelt es sich um eine Audiokodierung. Die ursprüngliche Musik-Datei wird komprimiert und umgewandelt. Eine .mp3-Datei kommt mit nur zehn Prozent der ursprünglichen Dateigröße aus. Diese Kompression wird in einer Kompressionsrate in kbit/s angegeben (Bitrate von 128 kbps bis zu 320 kbps). Je höher der Wert, desto besser die Qualität. Durch technische Verbesserungen wurde dieser Kompromiss hinfällig.

CD-Qualität ist vier Mal besser

Die CD-Qualität umfasst eine Reihe von Formaten (FLAC, ALAC, WMA Lossless), die ohne Verluste komprimiert oder nicht komprimiert sind und eine Abtastrate (16-Bit / 44.1 kHz) aufweisen, die mit der einer physischen CD identisch ist. Die verlustfreie Komprimierung ermöglicht das Reduzieren der Größe, ohne die ursprüngliche Qualität zu verändern. Die Bitrate liegt vier Mal so hoch wie die der MP3.

Hi-Res Audio (High Resolution, zu deutsch: hohe Auflösung) repräsentiert das (derzeitige) Nonplusultra der digitalen Audio-Welt. Die Qualität dieser Dateien übertrifft die Qualität der CD. Mit einer Abtastrate bis zu 192 kHz und einer Auflösung von 24-Bit entspricht der Klang dem Ergebnis aus dem Aufnahmestudio. Darüber hinaus wird der Zugewinn an Fülle von Hör- und Empfindungen beispiellos im Vergleich zur MP3 oder auch CD-Qualität!

Bitte wieviel Bit???

Oft wird mit dem Slogan „24 Bit“ geworben. Das betrifft die Auflösung des Tons. Sie bestimmt – einfach ausgedrückt – die Dynamik, also die Anzahl der Werte, die ein Ton annehmen kann. Je präziser die Dynamik ist, desto mehr sind Klangvariationen wahrnehmbar. Bei 8-Bit kann ein Ton 256 verschiedene Werte haben. Bei 16-Bit sind es 65.536 Werte – und bei 24-Bit 6.777.217!

192 kHz Abtastrate bedeutet, dass die Amplitude eines Signals in regelmäßigen Intervallen, welche durch die ermittelte Abtastrate fixiert werden, gemessen wird. Die Werte werden in kHz (Kilohertz) ausgedrückt. Je höher die Frequenz ist, desto orginialgetreuer und genauer wird die Tonübertragung. In CD-Qualität (44,1 kHz) werden jede Sekunde 44.100 Samples entnommen. In Hi-Res kann diese Frequenz 192 kHz (6,5-mal mehr als eine CD) erreichen.

Kompromiert und beliebt

Es gibt mehrere komprimierte Audio-Formate, welche die Wiedergabe-Qualität negativ beeinflussen. Das bekannteste ist MP3, welches im Internet am weitesten verbreitet ist. OGG ist die Abkürzung für ein von Patenten freies, der Qualität zur MP3 äquivalentes Format.

Mit den Buchstaben AAC wird das von Apple als Alternative zur MP3 gewählte Format bezeichnet, WMA heißt es, wenn es von Microsoft entwickelt wurde.  Als „Nicht destruktiv“ gelten Formate, die die Dateigröße verkleinern, ohne die Qualität zu reduzieren: FLAC, als freies Format, WMA Lossless von Microsoft sowie ALAC von Apple.

Die „rohen“ Verlustfreien

Kommen wir zu „rohen“ Formaten ohne Komprimierung oder Verluste und fangen bei WAV an. Ein Format, das in der Lage ist, unkomprimiertes von Microsoft & IBM entwickeltes Audiomaterial zu enthalten. Und AIFF, welches für unkomprimiertes, von Apple entwickeltes Audiomaterial maßgeschneidert ist.

DSD ist ein auf 1 Bit kodiertes Format mit einer sehr hohen Abtastrate (2,8 oder 5,6 MHz), das auf der Umwandlung von Delta Sigma basiert, bei dem lediglich die Variation des Signals kodiert wird. Es bietet eine Alternative zu PCM (Pulse Code Modulation), der auf allen oben genannten Formaten genutzten Umwandlungsmethode.

Der Codec als Wandler

Im Umgang mit digitalem Audio wird das Format durch seine Kodierung gekennzeichnet. Die Kodierung gibt die Anzahl der Bits, mit der die Datei kodiert wurde, und die Frequenz der Abtastrate an.
Ein Codec (Kodierer-Dekodierer) ist eine Soft- oder Hardware, die das Umwandeln einer digitalen Audio-Datei in das gewünschte Format ermöglicht (Kodierung) und das Lesen dieses Formates (Dekodierung) ermöglicht, um es in einen hörbaren, analogen Ton umzuwandeln.

Die Bitrate wird verwendet, um MP3 oder andere verlustbehaftete Dateien zu beschreiben und entspricht der Informationsbitrate (oder Bits) pro Sekunde. Eine Bitrate von 320 kbps entspricht ungefähr 320.000 Bits, die pro Sekunde übertragen werden (Kilobit pro Sekunde). Sie kann konstant (CBR) oder variabel (VBR) sein. Für Dateien in CD- oder Hi-Res-Qualität berechnet sich die Bitrate wie folgt: Frequenz der Abtastrate mal Anzahl der Bits (16 oder 24) mal Anzahl der Kanäle (2 bei Stereo).

Der DAC pimpt die Qualität…

Ein DAC (Digital to Analog Converter) ist eine externe Soundkarte, die man an einen Computer oder ein Smartphone anschließt. Sie hat die Aufgabe, digitale Audiodaten in analoge Signale umzuwandeln. Der Grund für die Verwendung eines DAC besteht darin, die schlechte Qualität der für das breite Publikum bestimmten internen Soundkarten der letzten Jahre auszugleichen, die oft nicht in der Lage sind, Dateien in Hi-Res 24-Bit zu unterstützen.

Ein Netzwerkplayer sollte CD-, SACD- oder Blu-Ray-Player ersetzen. Sobald er an einen Verstärker angeschlossen ist, verbindet er sich mit dem Heimnetzwerk (normalerweise durch Ethernet oder WLAN) und kann so im lokalen Netz auf alle Audio-Inhalte der verschiedensten Geräte zugreifen (PC, Smartphone, Tablets, I-Tunes-Bibliothek). Im Internet ermöglicht er den Zugriff auf Musik-Services wie Spotify, Tidal oder Qobuz.

…und ist meistens schon an Bord

Die Mehrzahl der Netzwerkplayer hat einen DAC integriert, der Lesen von Dateien in Hi-Res 24-Bit ermöglicht. Das bekannteste Digitalisierungsverfahren ist die PulsCodeModulation (PCM), die auch Basis für „normale“ Audio-CDs ist. Bei ihr werden kontinuierliche (analoge) Signale in diskrete, (digitale) Bitpakete gewandelt, die Abtastrate ist dabei konstant.

Eine Alternative zu PCM stellt unter anderem das für SACDs (Super Audio CD) maßgebliche Direct Stream Digital (DSD) dar, welches eine Abtastfrequenz von 2,8224 MHz oder auch 5,6448 MHz nutzt, mit denen analoge Frequenzen bis zu theoretisch 100.000 Hz rekonstruiert werden.

Immer nur ein Bit

Im Gegensatz zum PCM-Verfahren mit Quantisierung werden hier sogenannte Delta-Sigma-Werte, Änderungsangaben zum Verlauf des Audiopegels, genutzt. Jedes „Informationspaket“ enthält damit in wechselnder sogenannter Impulsbreite immer nur 1 Bit (also 0 oder 1), um die jeweilige „momentane“ Amplitudenänderungen zu repräsentieren.

Der Datenstrom einer SACD ist somit ein „Single Bit Pulse Stream“. Je dichter die Folge von Einsen, desto höher wird der Spannungswert, je mehr Nullen folgen, desto mehr senkt er sich wieder ab. DSD ähnelt dadurch analogen Signalen, was ein erklärtes Ziel der Entwickler dieses Formats war. Durch die sehr hohe Abtastfrequenz erfährt fast jede noch so winzige Amplitudenänderung des analogen Signals eine Repräsentation im Digitalen. Plausibler ausgedrückt, wird dem analogen Signal stetig „nachgefühlt“.

Hi-Res Siegeszug unaufhaltbar

Entgegen häufig zu hörender Meinung ist der Informationsgehalt bei DSD nicht automatisch höher als bei PCM. Die SACD etwa liefert pro Kanal 2,8224 Mbit/s, das liegt knapp über PCM mit 96 kHz/24 Bit (2,304 Mbit/s), aber signifikant unterhalb von PCM mit 192 kHz/24 Bit (4,608 Mbit/s). PCM in 192/24-Auflösung beinhaltet also bereits einen größeren Informationsgehalt.

Zusammenfassung: In Zeiten äußerst günstig herzustellender Massenspeicher bei gleichzeitig wesentlich komfortableren Formaten wird sich der Siegeszug von Hi-Res Audio konsequent fortsetzen und alte Standards ablösen. Bleibt am Ende der High-Tech-Kette der Mensch als „Entscheider“.

Mit oder Ohne – ganz nach Gusto

Sagt er, wie dereinst Karl Valentin „schlecht hören kann ich gut“, wird er Hi-Res-Audio nicht vermissen und ohne murren und knurren abrasierte hohe Frequenzen tolerieren. Handelt es sich um anspruchsvollere Personen, welche über ein in vielen Jahren geschultes Gehör verfügen, wird das Streben nach der Erschließung neuer Klangwelten weiterhin anhalten.

Wer jetzt selbst mal heimlich testen will, wie gut oder schlecht er hört, klicke auf diesen folgenden Link. Obwohl es eindeutige Barrieren gibt! Die Ohrwascheln des gemeinen Homo sapiens nehmen Töne in einem Spektrum zwischen 20 Hertz und 20 Kilohertz wahr. Frequenzen darunter und darüber, die als Infra- beziehungsweise Ultraschall bekannt sind, gelten als für den Menschen „unhörbar“.

Experten forschen noch

Dennoch berichten Menschen immer wieder, dass sie sich etwa von Geräten und Maschinen gestört fühlen, die im normal wahrnehmbaren Spektrum eigentlich nicht hörbar sind. Ein internationales Expertenteam hat sich vor etwa drei Jahren den Grenzen des menschlichen Hörens zugewandt und kommt zu dem Ergebnis, dass das Repertoire dessen, was der Mensch hören kann, größer ist als bislang bekannt.

Wer demnach feingeistige Zeitgenossen, die über äußerst sensible Gehör-Verästelungen in ihrem Privat-Schädel verfügen, mit Normal- oder Schlechthörern über einen Kamm schert, gebärdet sich geschert und unerhört und soll in höchsten Frequenzen gescholten werden!