Codierung von Sprache, Audio und Video

Prof. Dr. S. Feldes

Kurzinhalt der Vorlesung

Einführung – Redundanz & Irrelevanz, Qualitätsmaße, Stochastische Prozesse

Quantisierung – gleichförmige Quantisierung, Kompandierung, Lloyd-Max-Quantisierer, Vorwärts-/ rückwärtsadaptive Quantisierung, Vektorquantisierung, Codebuchdesign nach Linde-Buzo-Gray

Prädiktion – Prinzip der prädiktiven Codierung, Prädiktionsgewinn, Adaptive Prädiktion, Block- & LMS-Adaption, Open-Loop / Closed-loop, Rauschformung

Verlustlose Codierung – Entropiebegriff, Decodierbarkeit, gedächtnislose und gedächtnisbehaftete Quellen, Shannon Quellencodiertheorem, Huffman-Codierung, Arithmetische Codierung, Lempel-Ziv-Welch, Lauflängencodierung

Sprachcodierung – Funktionsweise der Spracherzeugung, Quelle-Filter-Modell, Vocoder, Linear Predictive Coding, Long Term Prediction, Analyse-durch-Synthese, CELP, Variable-Bitrate & Embedded Coding, Standards: GSM, ITU G.7xx

Audiocodierung – Eigenschaften & Funktionsweise des Ohres; Perzeptions-modelle, Verdeckung; Subband- und Transformationscodierung; MDCT, QMF-Filterbänke; Spectral Band Replication; Standards: MP3, AAC, HE-AAC

Bild- und Videocodierung – Eigenschaften & Funktionsweise des Auges; 2D-DCT, Wavelet-Transformation, Bewegungskompensierte Prädiktion, Bewegungsschätzung, Blockmatching; Standards: JPEG(2000), MPEG-1, -2,-4

Modulbeschreibung