| |
Variable Bitraten
Um diesen Problemen entgegenzuwirken kann man sich verschiedenster Techniken bedienen
und diese kombinieren. Dieser Abschnitt geht auf diese Techniken ein. Es werden zuerst bitra-
tenoptimierte Codecs und danach die von MPEG-4 vorgeschlagenen Maßnahmen zur Redu-
zierung von Fehlern vorgestellt. Abschließend wird ein Modell vorgestellt, wie eine Anpassung
an variable Bitraten unter möglichst geringem Qualitätsverlust möglich ist.
5.1 Codierung
In diesem Abschnitt werden die in MPEG-4 eingesetzten Verfahren zur Datenkompression
ausreichend detailliert vorgestellt. Detailliertere Beschreibungen zu den einzelnen Verfahren
finden sich zum Beispiel in [PuEl98] oder [Koen02].
5.1.1 Codierung von Video
Die Videocodierung in MPEG-4 kann in zwei Bereiche aufgeteilt werden:
Codierung von natürlichen Bildern
Codierung von synthetischen Bildern
Die Codierung von synthetischen Bildern wird nicht weiter behandelt, da sie nur auf Parame-
tern beruht. Der Kodiervorgang ist daher nicht sehr interessant. Der grösste Arbeitsaufwand
liegt beim Decoder.
Wie in Abschnitt 2 angesprochen, besteht eine Szene aus mehreren Objekten. Diese Objekte,
in diesem Fall Video-Objekte (VO) können zusammengefasst werden. Wenn man sich einen
Nachrichtensprecher im Fernsehen denkt, könnte man sich vorstellen, dass diese Szene aus
Sprecher, Programmlogo und Hintergrundbild besteht11. Man kann jetzt schon erkennen, dass
es verschiedene Codierverfahren für die einzelnen Objekte geben wird. Üblicherweise wird sich
das Programmlogo nie ändern, der Hintergund auch nicht. Der Sprecher wird sich (wenn auch
nicht viel) bewegen. Im Gegensatz zum Hintergrundbild (ausgehend vom Fernsehbild) besit-
zen der Sprecher mit Sicherheit sowie das Logo mit hoher Wahrscheinlichkeit keine rechteckige
Form. Im Fall von MPEG-4 wird der Transparenzbereich, also die Formgebung, durch eine
8-bit Transparency Component oder eine Binary Mask zugewiesen. Die Form- oder Profilin-
formation kann zum Beispiel mit Hilfe des Chroma-Key-Verfahrens gewonnen werden. Einen
Kodiervorgang für ein bewegtes Objekt zeigt Abbildung 6.
Für Texturen und sich nicht ändernde Bilder (wie Hintergrundbilder) wird nicht die Discrete
Cosinus Transform (DCT) eingesetzt. Man verwendet hier die Discrete Wavelet Transform
(DWT). Bilder wie ein Hintergrundbild müssen nur einmal übermittelt werden. Es können
später Parameter wie zum Beispiel Kamerawinkel eingestellt werden und auf Decoderseite
entsprechend reagiert werden.
5.1.2 Audio
Wie bei Videodaten lässt sich auch bei den Audio-Daten ein synthetischer und ein natürli-
cher Bereich definieren. Für den synthetischen Bereich gilt wiederum, dass der Decoder die
Hauptaufgabe erledigt und die Kodierung deshalb weniger interessant ist. Für die Codierung
von natürlichen Audiodaten bietet MPEG-4 folgende Codierverfahren:
11den Ton sowie weitere, eventuelle Randobjekte werden der Einfachheit halber vernachlässigt
7
|  |
|
| |
|
|