Diskrete Orthogonaltransformationen PDF

Kompression von Audio- und Bilddaten verwendet. Audio- und Videosignale weisen typischerweise im unteren Spektralbereich hohe Signalenergien auf, zu deren Dekorrelation sich die Diskrete Orthogonaltransformationen PDF besonders gut eignet und die verbreitete Verwendung dieser Transformation erklärt.


Författare: Philipp W. Besslich.
Sei t Bekanntwerden "schneller" Algori Uunen haben orthogonale Transformatio nen in der digitalen Signalverarbeitung zunehmend an Bedeutung gewonnen. Ausgehend vom "klassischen" Cooley-Tukey-Algorithmus der diskreten Fourier Transformation wurde eine Vielzahl anderer Algori thmen mit dem Ziel ent wickelt. den Rechenaufwand weiter zu reduzieren. So entstanden z.B. der Primfaktor-Algorithmus. der Winograd-Algorithmus und der Split-Radix-AIgo rithmus der DFT. AuBerdem wurden schnelle Algorithmen fur andere Transforma tionen. wie die Walsh-. Haar-. Cosinus-Transformation etc. bekannt. Viele dieser Transformationsalgorithmen kennen vom Rechner stufenweise. d.h. in Iterationen abgearbeitet werden. so daB La. eine speichersparende "in place"-Verarbeitung mOg~ich ist. Wegen der rasanten Entwicklung auf dem Gebiet der digitalen Bildverarbeitung hat das Interesse an zweidimensionalen Orthogonaltransformationen in letzter Zeit stark zugenommen. Infolgedessen entstanden zahlreiche Algorithmen fur 2D-Transformationen. Haufig wird hierbei von der Separierbarkeit in Zeilen und Spal tentransformationen Gebrauch gemacht. Es hat sich jedoch gezeigt. daB anders geartete Algorithmen (z.B. die Berechnung aus Koeffizienten nie drigerer Ordnung) vorteilhafter sein kennen. Vor dem Hintergrund der Verfugbarkeit von integrierten Schaltungen zur DurchfUhrung orthogonaler Transformationen gewinnt die Signalverarbeitung im Transformationsbereich eine neue Dimension. Die Moglichkeit. spezielle Transformationsalgorithmen als (semJ-) kundenspezifische integrierte Schal tungen zu realisieren. laBt die Kenntnis bestehender Algorithmen sowie der ihnen zugrunde liegenden Prinzipien besonders aktuell erscheinen. Mit diesem Buch werden mehrere Ziele verfolgt: Nach einer Ubersicht uber die wichtigsten Orthogonaltransformationen (Kapitel 2) werden einige grundsatz- VI liche Probleme der diskreten "schnellen" Transformations-Algorithmen behan delt (Kapitel 3). Dazu ziililen u.a.: KomplexiUi.t. Berechnungs-Strategien (z .B. direkte und indirekte Berechnung der Transformationskoeffizienten).

Wie andere diskrete Frequenztransformationen drückt auch die diskrete Kosinustransformation eine endliche Eingangssignalfolge als eine endliche Summe von gewichteten trigonometrischen Funktionen mit unterschiedlichen Frequenzen aus. Die diskrete Fouriertransformation, welche über eine endliche Eingangsfolge definiert ist, besitzt implizit durch die Art der Transformation und deren Randbedingungen auch eine Festlegung, wie die Eingangsdatenfolge außerhalb dieser endlichen Folge fortgesetzt wird. Bei der Art der Fortsetzung der Eingangsdatenfolge und deren Unterscheidung in gerade und ungerade Fortsetzung ergeben sich unterschiedliche Kombinationen. Daraus ergeben sich vier verschiedene Möglichkeiten. Weiter ist festzulegen, ab welcher Position in der Folge die Fortsetzung zu erfolgen hat. Die verschiedenen Formen werden in der Literatur als DCT-I bis DCT-VIII und DST-I bis DST-VIII bezeichnet. Diese unterschiedlich fortgesetzten Folgen bestimmen wesentlich die Eigenschaft der einzelnen Transformationen und deren praktische Bedeutung.

Bei der Lösung von partiellen Differentialgleichungen mittels Spektraltransformation werden dabei je nach Problemstellung alle Varianten der DCT oder DST eingesetzt. Im Bereich der verlustbehafteten Audiosignalkompression, wie dem Dateiformat MP3, muss ein fortlaufender diskreter Audiodatenstrom transformiert werden, wobei zur Vermeidung von Alias-Effekten im Zeitbereich die MDCT, die auf einer eindimensionalen DCT-IV basiert, eingesetzt wird. Im Bereich der Bild- und Audiokompression bestimmt die Art der Fortsetzung und somit die Randwerte, wie gut sich die Transformation für die Datenkompression eignet. Der Grund dafür ist, dass Sprünge in der Signalfolge zu hohen Koeffizientenwerten in allen Frequenzbändern und damit insbesondere zu hochfrequenten spektralen Anteilen führen.

Dies gilt auch, wenn diese Sprünge an den Rändern der Signalfolge infolge einer ungünstigen Fortsetzung auftreten. Die diskrete Fouriertransformation ist im Allgemeinen eine komplexwertige Transformation und durch die periodische Fortsetzung können an den Randstellen Sprünge im Signalverlauf auftreten. Dies gilt auch für die diskrete Sinustransformation, die am Anfang der Folge eine ungerade Fortsetzung aufweist. Im Gegensatz zur diskreten Fourier-Transformation sind alle Formen der DCT reelle Transformationen und liefern reelle Koeffizienten. Die DCT kann sowohl in Software als auch in Hardware effizient implementiert werden.

Zahlen langen Folge abcde bis auf den Faktor 2 identisch zu der DFT der Folge abcdedcb. Die DCT-II ist die übliche DCT. Elementen mit gerader Symmetrie, wobei alle Elemente mit geradem Index den Wert 0 aufweisen. Die DCT-III ist die Umkehrung der DCT-II.

Datenfolgen der einzelnen Datenblöcke ähnlich wie bei dem Overlap-Add-Verfahren überlappt werden, um einen aperiodischen Verlauf zu erhalten. Wie einige andere Transformationen kann auch die DCT umgekehrt werden. Die Vorfaktoren der DCT sind in der Literatur nicht einheitlich festgelegt. Faktor bei der inversen Operation zu vermeiden. Durch geeignete Wahl des konstanten Faktors kann die Transformationsmatrix eine orthogonale Matrix darstellen. Insbesondere in der digitalen Bildverarbeitung spielt die zweidimensionale DCT, basierend auf der DCT-II, eine wesentliche Rolle.

Die Erweiterung auf mehrere Dimensionen erfolgt im einfachsten Fall durch eine spalten- oder zeilenweise Anwendung der Transformation. Für praktische Implementierungen existieren zur Berechnung höherdimensionaler Transformationen effizientere Algorithmen. Die rechte Abbildung zeigt als einfaches Beispiel alle Spektralkomponenten einer zweidimensionalen DCT-II mit in jeder Dimension acht Koeffizienten. Gleichanteil des Signals dar, in horizontaler Richtung sind die horizontalen Frequenzanteile aufsteigend. Indizes hinweg wird die Frequenz verdoppelt. 8-Blöcke eingeteilt, die einer 2D-DCT unterzogen werden. In Filmformaten wird mitunter auch 3D-DCT angewendet.