Tonstandards

Angefangen hat alles mit dem analogen Monoton. Anfang der 70er Jahre hat dann der analoge Stereoton in die Kinos Einzug genommen. Dieser hat die Entwicklung der Mehrkanaltechnik in den darauffolgenden Jahrzehnten geprägt. Um abwärtskompatibel zu bleiben, mussten weitere Kanäle in das Stereosignal mittels einer Matrix hineinkodiert werden. Die Dolby-Laboratories brachten über die Jahre etliche Verfahren in die Kinos, um 4 Kanäle in der analogen Stereospur unterzubringen. Diese Verfahren werden Quadrophonie genannt. Die beiden zusätzlichen Kanäle werden durch einen Center-Lautsprecher vorn in der Mitte und 2 Lautsprecher hinten rechts und links (Rear) dargestellt. Die beiden Rear-Lautsprecher teilen sich dabei den gleichen Tonkanal, es ist also kein Tonunterschied zwischen dem rechten und linken Rear-Lautsprecher darstellbar. Insgesamt werden also 5 Lautsprecher benötigt um 4 Kanäle darzustellen, die wiederum in nur 2 analogen Tonkanälen (Stereo) kodiert sind. Wenn ein solches Dolby-Surround-Signal mit einem normalen Stereoradio empfangen wird, kann man ganz normalen Stereoton hören. Das Dolby-Surround-Verfahren ist das letzte Quadrophonieverfahren gewesen. Alle aktuellen Mehrkanallösungen bauen auf einer digitalen Tonkodierung auf.

Bei der Digitalisierung von Audio wird das analoge Tonsignal mit einer bestimmten Frequenz abgetastet. Typisch sind heute Werte von 44,1kHz oder 48kHz und deren Vielfache und Teiler. Die maximal darstellbare Frequenz nach der Abtastung liegt dabei immer bei der Hälfte der Abtastfrequenz (Abtasttheorem von Nyquist und Shannon). Bei einer Abtastfrequenz (Sample-Rate) von 44,1kHz lassen sich also Frequenzen bis knapp über 22kHz darstellen. Da die Grenze des Hörbaren bei etwa 20kHz liegt, sind wesentlich größere Abtastfrequenzen von etwa 96kHz (wie sie die Audio-DVD-Spezifikation erlaubt) eigentlich unsinnig. Da unser Gehör Lautstärkedifferenzen logarithmisch aufnimmt, werden an jeder Abtaststelle die Momentanwerte der Audiokurve logarithmisch als Dualzahl (Sample) abgespeichert. Typischerweise werden dabei 8bit, 16bit oder 24bit-Samples benutzt. Dieser Momentanwert kann also genau einen von 2^8bit = 256 bzw. 2^16bit = 65.536 bzw. 2^24bit = 16.777.216 Werten annehmen. Manchmal werden auch 32bit-Floating-Point-Zahlen eingesetzt. Floating-Point heißt, dass die Zahl als binäre Zweier- (im Binärsystem also 10er-)Potenz gespeichert wird (z.B. -10111001101110110101110*10^11011001) und somit einen noch weitaus größeren Zahlenbereich abdecken kann.

Beispielbild zur Abtastung

Dieses Verfahren nennt sich Pulse-Code-Modulation (PCM) und wird z.B. bei Telefonsprachverbindungen über ISDN ohne Kompression eingesetzt (8kHz Sample-Rate * 8bit pro Sample = 64kbit/s = Bandbreite eines ISDN-Kanals). Normalerweise wird dieser Datenstrom, der in jedem Tonkanal 1x anfällt, anschließend komprimiert. Die heutzutage weitverbreitetste Kompression ist MPEG-Audio Layer 3 (mp3). Liegt der Ton nicht in Mono vor, wird für jeden Tonkanal ein solcher Stream erzeugt. Wenn der Ton nun in Form von Streams (digitalisierten Audiokanälen) vorliegt, ist es nicht mehr schwer, 2 oder mehr davon in einer Datei oder einem Audiostream einer Videodatei unterzubringen. 5.1-AC3-Streams beinhalten beispielsweise 6 unabhängige komprimierte Streams.

Darstellung der Streams einer Videodatei

Die Folgende Tabelle stellt den Platzbedarf ohne Kompression pro Kanal bei verschiedenen Werten für Sample-Rate und Sample-Auflösung dar:

Speicherbedarf 8bit 16bit 24bit 32bit Float
8kHz 64kbit/s 128kbit/s 192kbit/s 256kbit/s
11,025kHz 88,2kbit/s 176,4kbit/s 264,6kbit/s 352,8kbit/s
12kHz 96kbit/s 192kbit/s 288kbit/s 384kbit/s
16kHz 128kbit/s 256kbit/s 384kbit/s 512kbit/s
22,05kHz 176,4kbit/s 352,8kbit/s 529,2kbit/s 705,6kbit/s
24kHz 192kbit/s 384kbit/s 576kbit/s 768kbit/s
32kHz 256kbit/s 512kbit/s 768kbit/s 1Mbit/s
44,1kHz 352,8kbit/s 705,6kbit/s 1058,4kbit/s 1411,2kbit/s
48kHz 384kbit/s 768kbit/s 1,125Mbit/s 1,5Mbit/s

Inhalts- oder Tippfehler gefunden? Dann informieren Sie mich bitte:

Betreff (bitte aussagekräftig!):
Nachricht:
Antwort-Mailadresse:
Sicherheitscode:ef16
Sicherheitscode eingeben: