Zur Modulseite PDF generieren

#41121 / #1

Seit WiSe 2023/24

Deutsch

Grundlagen der automatischen Spracherkennung

6

Kolossa, Dorothea

Benotet

Portfolioprüfung

Deutsch

Zugehörigkeit


Fakultät IV

Institut für Energie und Automatisierungstechnik

34311900 FG Elektronische Systeme der Medizintechnik

Keine Angabe

Kontakt


EN 3

Yu, Wentao

wentao.yu@tu-berlin.de

Lernergebnisse

Die Teilnehmer verstehen die theoretischen und praktischen Grundlagen automatischer Spracherkennungssysteme. Sie sind in der Lage, die Kernalgorithmen eines einfachen Spracherkenners selbstständig zu implementieren und verstehen die Prinzipien von aktuellen Erkennungssystemen für kleines und großes Vokabular. Dadurch sind sie auch in der Lage, Prinzipien der automatischen Mustererkennungsverfahren für ein breites Anwendungsfeld zu erkennen und kreativ auf neue, verwandte Aufgabenstellungen anzuwenden.

Lehrinhalte

In der Vorlesung werden zunächst physiologische und linguistische Grundlagen dargestellt. Es schließt sich eine Einführung in die benötigten mathematischen Grundlagen der Statistik und deren Umsetzung in der Bayes’schen Klassifikation an. Schließlich wird die Anwendung der vorgestellten Methoden zur Klassifikation von Zeitreihen auf das Problem der maschinellen Spracherkennung vorgestellt, wobei tiefe neuronale Netze und deren Einsatz zur Einzelworterkennung und zur Erkennung fließender Sprache einen Schwerpunkt darstellt. Ein Gastvortrag aus der Industrie verstärkt den Praxisbezug. Innerhalb der Rechnerübung wird in einer aufeinander aufbauenden Reihe von Programmierübungen in Gruppenarbeit ein Spracherkenner für fließend gesprochene Ziffernketten auf der Grundlage von tiefen neuronalen Netzen in einer Encoder-Decoder-Architektur erstellt. Alle dazu benötigten Module, von der Merkmalsextraktion bis zur Ausgabe und Evaluation der Ergebnisse, werden dafür eigenständig in den Gruppen von zwei bis vier Studierenden implementiert.

Modulbestandteile

Pflichtbereich

Die folgenden Veranstaltungen sind für das Modul obligatorisch:

LehrveranstaltungenArtNummerTurnusSpracheSWS ISIS VVZ
Automatische SpracherkennungVLWiSede2
Automatische SpracherkennungPRWiSede2

Arbeitsaufwand und Leistungspunkte

Automatische Spracherkennung (VL):

AufwandbeschreibungMultiplikatorStundenGesamt
Präsenzzeit15.02.0h30.0h
Vor-/Nachbereitung15.04.0h60.0h
90.0h(~3 LP)

Automatische Spracherkennung (PR):

AufwandbeschreibungMultiplikatorStundenGesamt
Präsenzzeit15.02.0h30.0h
Vor-/Nachbereitung15.04.0h60.0h
90.0h(~3 LP)
Der Aufwand des Moduls summiert sich zu 180.0 Stunden. Damit umfasst das Modul 6 Leistungspunkte.

Beschreibung der Lehr- und Lernformen

Die Lehrinhalte werden vermittelt durch Vorlesungen, Programmierübungen und einen Gastvortrag.

Voraussetzungen für die Teilnahme / Prüfung

Wünschenswerte Voraussetzungen für die Teilnahme an den Lehrveranstaltungen:

- Grundlagen der Systemtheorie, wie sie bspw. in 'Signale und Systeme' vermittelt werden. - Programmierkenntnisse in mindestens einer Programmiersprache

Verpflichtende Voraussetzungen für die Modulprüfungsanmeldung:

Dieses Modul hat keine Prüfungsvoraussetzungen.

Abschluss des Moduls

Benotung

Benotet

Prüfungsform

Portfolioprüfung

Art der Portfolioprüfung

100 Punkte insgesamt

Sprache(n)

Deutsch

Prüfungselemente

NamePunkteKategorieDauer/Umfang
(Ergebnisprüfung) Abgabe des Quellcodes aus der Programmierübung in Python1praktischQuellcode Erkennungssystem (11 Teilaufgaben)
(Punktuelle Leistungsabfrage) Schriftlicher Test zu den Inhalten der Vorlesung1schriftlich60 Minuten

Notenschlüssel

Notenschlüssel »Notenschlüssel 2: Fak IV (2)«

Gesamtpunktzahl1.01.31.72.02.32.73.03.33.74.0
100.0pt95.0pt90.0pt85.0pt80.0pt75.0pt70.0pt65.0pt60.0pt55.0pt50.0pt

Prüfungsbeschreibung (Abschluss des Moduls)

Es gibt pro Aufgabenblatt 10 Punkte und zusätzlich einmalig 10 Bonuspunkte für das Erkennungsergebnis des implementierten Systems. Die erreichte Punktzahl wird auf 110 nach oben begrenzt und durch 110 geteilt, um die Prozentnote zu errechnen, aus der dann entsprechend der üblichen Umrechnungstabelle die Note der Übung bestimmt wird

Dauer des Moduls

Für Belegung und Abschluss des Moduls ist folgende Semesteranzahl veranschlagt:
1 Semester.

Dieses Modul kann in folgenden Semestern begonnen werden:
Wintersemester.

Maximale teilnehmende Personen

Die maximale Teilnehmerzahl beträgt 40.

Anmeldeformalitäten

Anmeldung zu der LV über ISIS. Prüfungsanmeldung erfolgt über MTS

Literaturhinweise, Skripte

Skript in Papierform

Verfügbarkeit:  nicht verfügbar

 

Skript in elektronischer Form

Verfügbarkeit:  nicht verfügbar

 

Literatur

Empfohlene Literatur
Keine empfohlene Literatur angegeben

Zugeordnete Studiengänge


Diese Modulversion wird in folgenden Studiengängen verwendet:

Studiengang / StuPOStuPOsVerwendungenErste VerwendungLetzte Verwendung
Audiokommunikation und -technologie (M. Sc.)12SoSe 2025SoSe 2025
Computer Engineering (M. Sc.)128WiSe 2023/24SoSe 2025
Computer Science (Informatik) (M. Sc.)18WiSe 2023/24SoSe 2025
Elektrotechnik (M. Sc.)120WiSe 2023/24SoSe 2025
Medieninformatik (M. Sc.)15WiSe 2023/24SoSe 2025
Medientechnik (M. Sc.)14SoSe 2025SoSe 2025
Wirtschaftsingenieurwesen (M. Sc.)16SoSe 2024SoSe 2025

Sonstiges

Keine Angabe