912776

Besser als MP3: MPEG-4 AAC

06.06.2003 | 15:09 Uhr |

Mit Quicktime 6.2 und iTunes 4 setzt Apple bei Musikdateien nicht nur auf das bekannte MP3-Format, sondern auch auf das neue Format MPEG-4 AAC. Für die aktuelle Macwelt 7|2003 haben wir geprüft, was das für die Zukunft des digitalen Lebens in puncto Audio bedeutet.

Geht  es nach Apple, löst MPEG-4 schon bald MP3 ab, denn es bietet entscheidende Vorteile. So beinhaltet MPEG-4 AAC eine direkte Implementierung von MPEG-2 AAC und nutzt die menschliche Hörkurve aus. Das Audiosignal wird einer Frequenzanalyse unterzogen, und aus diesem Ergebnis werden anhand der Erkenntnisse über die simultanen und temporalen Frequenzverdeckungen des menschlichen Gehörs unnötige Frequenzanteile weggelassen. Zu einer Rauschminimierung wird das Audiosignal in Subbänder unterteilt und analysiert. Anschließend dient ein angepasstes Quantisierungsverfahren dazu, das Quantisierungsrauschen unter der Maskierungsschwelle des menschlichen Gehörs zu halten. Das Ergebnis ist eine kleinere Datenmenge ohne "hörbare" Einbußen an Qualität.

Datenorakel - gute Vorhersagen

Eine weitere Neuerung von AAC ist die Vorhersage  "Prediction", die mit speziell angepassten Algorithmen versucht, den jeweils folgenden Messwert vorherzusagen. Das System wurde für schmalbandige Sprachsignale entwickelt, weil diese Signale besonders leicht vorherzusagen sind. Prediction sorgt für einen effektiveren Einsatz der meist geringen verfügbaren Bandbreite. Sie wird sowohl im Zeit- als auch im Frequenzbereich eingesetzt.
Um für die Zukunft gewappnet zu sein, enthält AAC Zusätze, die sich an neuen Übertragungswegen wie dem Internet-Streaming oder Wireless-Anwendungen orientieren. Diese beinhalten eine bessere Fehlerkorrektur für unsichere Übertragungsstrecken. Neu ist auch die Skalierbarkeit, bei der die Datenrate je nach Qualität und Geschwindigkeit der Übertragungsstrecke verringert wird, was nicht nur bei schlechten sondern auch langsamen Verbindungen hilft. Erreicht wird dies durch die Unterteilung des Gesamtdatenstroms in mehrere Teildatenströme, die hierarchisch dekodiert werden, um jeweils einen Teil des Gesamtsignals wiederherzustellen. Das Originalsignal durchläuft dafür eine erste Kodierung und Dekodierung, der resultierende Datenstrom wird als erstes Layer, genannt "Base Layer" des kombinierten Gesamtdatenstroms gesendet. Es trägt die grundlegenden Informationen des Audiosignals und kann bei langsamen Verbindungen auch alleine zur Rekonstruktion verwendet werden. Für das zweite bis n-te Layer, die so genannten "Enhancement Layers", wird das dekodierte Ergebnis des ersten Durchlaufs mit dem Originalsignal verglichen und das daraus resultierende Fehlersignal wiederum als Stream kodiert. Wiedergabeseitig werden diese Zusatzinformationen zur qualitativen Verbesserung des Grundsignals aus dem "Base Layer" verwendet, sind aber zur Dekodierung nicht zwingend notwendig. Dieser Vorgang kann theoretisch beliebig oft wiederholt werden, in der Praxis liegt die Anzahl bei drei bis vier Durchgängen. Hieraus resultiert eine Qualität, die etwas niedriger ist, als die von Single-Pass- AAC-Dateien, aber dennoch meist höher als die von MP3-kodierten Stücken.
Außerdem hat man an die Musikindustrie gedacht und ein ausgeklügeltes Digital Rights Management implementiert, welches beim "iTunes Music Store" zum Beispiel das Brennen auf CD und das Überspielen auf beliebig viele iPods zulässt.

0 Kommentare zu diesem Artikel
912776