Sprachverarbeitung

Prof. Dr.-Ing. S. Feldes

Kurzinhalt der Vorlesung



Die Sprache gehört zu den natürlichsten Mitteln der menschlichen Kommunikation. Die Vorlesung gibt einen Überblick über die wesentlichen Methoden der Sprachverarbeitung. Nach einer Einführung in die menschliche Spracherzeugung und Sprachwahrnehmung werden die algorithmischen Grundlagen der Sprachsynthese und Spracherkennung erarbeitet. Dabei wird insb. die Spracherkennung vertieft auf der Methodik des Maschinellen Lernens entwickelt. In einem abschließenden Anwendungsentwicklungsprojekt werden mit Hilfe einer Middleware-Plattforn die Basistechnologien zu einem Sprachdialogsystem verknüpft.


Einführung
– Teilgebiete der Sprachverarbeitung & Anwendungsfelder mit Beispielen

Sprachsignal und Spracherzeugung –Sprachsignal im Zeit- und Spektralbereich, Spektrogramme, Stimmgrundfrequenz, Formanten; Spracherzeugung beim Menschen; Quelle-Filter-Modell; Matlab-Labor zur Sprachsignalanalyse.

Ohr und Hören – Aufbau und Funktionsweise des Ohrs; Psychoakustik, Critical Bands, Verdeckung, Gehörbezogene Tonhöhen- und Lautheitsmaße (Bark, Phon, …)

Sprachsynthese –Parametrische Synthese (artikulatorisch, HMM); Zeitbereichssynthese (PSOLA, Unit-Selection); Prosodie; Text-To-Speech, syntaktische, lexikalische & phonetische Verarbeitung.

Spracherkennung – Spracherkennung als Maschineller Lernvorgang, Merkmalsextraktion (LPC, Mel-Cepstrum); Statistische Klassifikatoren (MAP, ML); Dynamic Time Warping; Hidden-Markov-Modelle, Viterbi-Decodierung, Phonetisch-akustische Modellierung, Language Models, Deep Neural Networks, Labor zur Spracherkennung (HTK)

Anwendungen – Diktiersysteme, Sprachdialogsysteme, Multimodale Systeme; Sprachverstehen, kontextfreie Grammatiken, Sprachdialogentwicklung, Labor zu VoiceXML

Modulbeschreibung