Veranstaltung

LV-Nummer
Gesamt-Lehrleistung 32,00 UE
Semester WiSe 2024/25
Veranstaltungsformat LV / Praktikum
Gruppe Termingruppe 1
Organisationseinheiten Technische Universität Berlin
Fakultät IV
↳     Institut für Energie und Automatisierungstechnik
↳         34311900 FG Elektronische Systeme der Medizintechnik
URLs
Label
Ansprechpartner*innen
Schwidtal, Elisabeth ; Zeiler, Steffen ; Yu, Wentao
Verantwortliche
Sprache Deutsch

Termine (1)


Mi. 16.10 - 18.12.24, wöchentlich, Mi. 08.01 - 12.02.25, wöchentlich, 14:00 - 15:30

Charlottenburg

34311900 FG Elektronische Systeme der Medizintechnik

32,00 UE
Einzeltermine ausklappen
Legende
08:00
09:00
10:00
11:00
12:00
13:00
14:00
15:00
16:00
17:00
Mo.
Di.
Mi.
Automatische Spracherkennung (Praktikum)
Termingruppe 1
Charlottenburg
Yu, Wentao; Zeiler, Steffen
Do.
Fr.
Kalender als PDF exportieren

Grundlagen der automatischen Spracherkennung -

Die Veranstaltung behandelt alle wesentlichen Aspekte der automatischen Spracherkennung, einschließlich der Implementierung eines einfachen, aber vollständigen Spracherkennungssystems in Python.

In der Vorlesung werden zunächst physiologische und linguistische Grundlagen der Spracherzeugung und Sprachwahrnehmung dargestellt. Es schließt sich eine Einführung in die benötigten mathematischen Grundlagen der Statistik und deren Umsetzung in der Bayes’schen Klassifikation und dem maschinellen Lernen an. Schließlich wird die Anwendung der vorgestellten Methoden auf das Problem der maschinellen Spracherkennung vorgestellt, wobei tiefe neuronale Netze und deren Einsatz zur Einzelworterkennung und zur Erkennung fließender Sprache einen Schwerpunkt darstellen. Ein Gastvortrag aus der Industrie verstärkt den Praxisbezug.

Innerhalb der Rechnerübung wird in einer aufeinander aufbauenden Reihe von Programmierübungen in Gruppenarbeit ein Spracherkenner für fließend gesprochene Ziffernketten auf der Grundlage von tiefen neuronalen Netzen in einer hybriden Architektur erstellt. Alle dazu benötigten Module, von der Merkmalsextraktion bis zur Ausgabe und Evaluation der Ergebnisse, werden dafür eigenständig in den Gruppen von zwei bis vier Studierenden implementiert.

Die Teilnehmer:innen verstehen die theoretischen und praktischen Grundlagen automatischer Spracherkennungssysteme. Sie sind in der Lage, die Kernalgorithmen eines einfachen Spracherkenners selbstständig zu implementieren und verstehen die Prinzipien von aktuellen Erkennungssystemen für kleines und großes Vokabular. Dadurch sind sie auch in der Lage, Prinzipien des maschinellen Lernens von Zeitreihenmodellen für ein breites Anwendungsfeld zu erkennen und kreativ auf neue, verwandte Aufgabenstellungen anzuwenden.

Vorlesung: Di 14:00-16:00 Uhr im E 020

Praktikum: Mi 14:00 – 16:00 / Mi 16:00 – 18:00 Uhr im EN519

Gruppeneinteilung im ersten Vorlesungstermin, Dienstag, den 15.10.2024.

Weitere Informationen und Voranmeldung zum Programmierpraktikum im ISIS Kurs.