Zur Modulseite PDF generieren

#40969 / #2

WiSe 2022/23 - SoSe 2024

Englisch

Advanced topics in Reinforcement Learning
Weiterführende Themen im Bereich verstärkendes Lernen

6

Obermayer, Klaus

Benotet

Portfolioprüfung

Englisch

Zugehörigkeit


Fakultät IV

Institut für Softwaretechnik und Theoretische Informatik

34351300 FG Neuronale Informationsverarbeitung

Keine Angabe

Kontakt


MAR 5-6

Groiß, Camilla

sekr@ni.tu-berlin.de

Lernergebnisse

Die Studierenden sind in der Lage, sich in aktuelle Themen im Bereich Deep-Reinforcement Learning selbständig einzuarbeiten, anzuwenden und die Ergebnisse den anderen Studenten zu präsentieren. Sie erhalten ein speziferisches und tieferes Verständnis davon, wie das menschliche Gehirn funktioniert. Die Fähigkeiten umfassen Literaturarbeit, Implementierung und Anwendung eines maschinellen Lern-Algorithmus, Durchführung und Bewertung von Experimenten, adäquate Präsentation und Diskussion von Ergebnissen von aktuellen Techniken im Bereich Maschinelles Lernen.

Lehrinhalte

Die Teilnehmer werden sich in die aktuelle Literatur zum Thema Reinforcement Learning einarbeiten. Anschließend wird ein Thema, welches frei wählbar ist, von den Teilnehmern implementiert und auf ein Test- Datenset angewendet; Ergebnisse als auch das Thema selbst werden in der Gruppe vorgestellt.

Modulbestandteile

Pflichtbereich

Die folgenden Veranstaltungen sind für das Modul obligatorisch:

LehrveranstaltungenArtNummerTurnusSpracheSWS ISIS VVZ
Advanced topics in Reinforcement LearningSEM3435 L 10262WiSe/SoSeen2

Arbeitsaufwand und Leistungspunkte

Advanced topics in Reinforcement Learning (SEM):

AufwandbeschreibungMultiplikatorStundenGesamt
Präsenzzeit15.02.0h30.0h
Vor-/Nachbereitung15.010.0h150.0h
180.0h(~6 LP)
Der Aufwand des Moduls summiert sich zu 180.0 Stunden. Damit umfasst das Modul 6 Leistungspunkte.

Beschreibung der Lehr- und Lernformen

Teilnehmer werden sich in die aktuelle Literatur zum Thema Reinforcement Learning selbstständig einarbeiten. Nach der Wahl des Themas werden die Teilnehmer die Techniken auf einen auszuwählenden Test-Datensatz anwenden und sowohl die Ergebnisse als auch das Thema selbst vorstellen.

Voraussetzungen für die Teilnahme / Prüfung

Wünschenswerte Voraussetzungen für die Teilnahme an den Lehrveranstaltungen:

Erwünschte Fähigkeiten: sich selbständig in ein Thema einarbeiten zu können, Erfahrung in der Präsentation von wissenschaftlichen Ergebnissen, Grundkenntnisse der Künstlichen Intelligenz Teilnehmer sollten über Grundkenntnisse der Themen verfügen, die in den Lehrveranstaltungen Machine Intelligence I und II behandelt werden.

Verpflichtende Voraussetzungen für die Modulprüfungsanmeldung:

Dieses Modul hat keine Prüfungsvoraussetzungen.

Abschluss des Moduls

Benotung

Benotet

Prüfungsform

Portfolioprüfung

Art der Portfolioprüfung

100 Punkte insgesamt

Sprache(n)

Englisch

Prüfungselemente

NamePunkteKategorieDauer/Umfang
(Deliverable assessment) Coding project30praktisch30 Stunden
(Deliverable assessment) Project presentation50praktischKeine Angabe
(Deliverable assessment) Literature review20schriftlichKeine Angabe

Notenschlüssel

Notenschlüssel »Notenschlüssel 2: Fak IV (2)«

Gesamtpunktzahl1.01.31.72.02.32.73.03.33.74.0
100.0pt95.0pt90.0pt85.0pt80.0pt75.0pt70.0pt65.0pt60.0pt55.0pt50.0pt

Prüfungsbeschreibung (Abschluss des Moduls)

Portfolio-Prüfung Gesamtpunktzahl 100

Dauer des Moduls

Für Belegung und Abschluss des Moduls ist folgende Semesteranzahl veranschlagt:
1 Semester.

Dieses Modul kann in folgenden Semestern begonnen werden:
Winter- und Sommersemester.

Maximale teilnehmende Personen

Die maximale Teilnehmerzahl beträgt 30.

Anmeldeformalitäten

Anmeldung über MOSES; Prüfungssprache ist Englisch.

Literaturhinweise, Skripte

Skript in Papierform

Verfügbarkeit:  nicht verfügbar

 

Skript in elektronischer Form

Verfügbarkeit:  nicht verfügbar

 

Literatur

Empfohlene Literatur
Sutton, R.S. & Barto, A.G.: reinforcement learning: An introduction. MIT press, 2018
Bertsekas, D.: Reinforcment Learning and Optimal Control. Athena Scientific, 2019
Amodei, D., Olah, J., Steinhardt, J. Christiano, P., Schulman, J. and Mane, D.: Concrete Problems in AI Safety. 2016

Zugeordnete Studiengänge


Diese Modulversion wird in folgenden Studiengängen verwendet:

Studiengang / StuPOStuPOsVerwendungenErste VerwendungLetzte Verwendung
Dieses Modul findet in keinem Studiengang Verwendung.

Studierende anderer Studiengänge können dieses Modul ohne Kapazitätsprüfung belegen.

Sonstiges

Keine Angabe