Sind Sie sich sicher?
Der Kurs wird planmäßig in Präsenz stattfinden!
Grundlagen der Automatischen Spracherkennung
In der Vorlesung werden zunächst physiologische und linguistische Grundlagen dargestellt. Es schließt sich eine Einführung in die benötigten mathematischen Grundlagen der Statistik und deren Umsetzung in der Bayes’schen Klassifikation an. Schließlich wird die Anwendung der vorgestellten Methoden zur Klassifikation von Zeitreihen auf das Problem der maschinellen Spracherkennung vorgestellt, wobei tiefe neuronale Netze und deren Einsatz zur Einzelworterkennung und zur Erkennung fließender Sprache einen Schwerpunkt darstellt. Ein Gastvortrag aus der Industrie verstärkt den Praxisbezug.
Innerhalb der Rechnerübung wird in einer aufeinander aufbauenden Reihe von Programmierübungen in Gruppenarbeit ein Spracherkenner für fließend gesprochene Ziffernketten auf der Grundlage von tiefen neuronalen Netzen in einer Encoder-Decoder-Architektur erstellt. Alle dazu benötigten Module, von der Merkmalsextraktion bis zur Ausgabe und Evaluation der Ergebnisse, werden dafür eigenständig in den Gruppen von zwei bis vier Studierenden implementiert.
Die Teilnehmer verstehen die theoretischen und praktischen Grundlagen automatischer Spracherkennungssysteme. Sie sind in der Lage, die Kernalgorithmen eines einfachen Spracherkenners selbstständig zu implementieren und verstehen die Prinzipien von aktuellen Erkennungssystemen für kleines und großes Vokabular. Dadurch sind sie auch in der Lage, Prinzipien der automatischen Mustererkennungsverfahren für ein breites Anwendungsfeld zu erkennen und kreativ auf neue, verwandte Aufgabenstellungen anzuwenden.
Vorlesung: Di 14:00-16:00 Uhr im M123
Praktikum: Mi 14:00 – 16:00 Uhr im EN519
Gruppeneinteilung im ersten Vorlesungstermin, Dienstag, den 17.10.2023.
Weitere Informationen im ISIS Kurs.
Absolventenseminar