Zur Modulseite PDF generieren

#30855 / #1

SoSe 2021 - WiSe 2021/22

Deutsch

Data Science in Engineering

3

Repke, Jens-Uwe

Benotet

Portfolioprüfung

Deutsch

Zugehörigkeit


Fakultät III

Institut für Prozess und Verfahrenstechnik

33351500 FG Dynamik und Betrieb technischer Anlagen

MSc Energie- und Verfahrenstechnik

Kontakt


KWT 9

Hoffmann, Christian

lehre@dbta.tu-berlin.de

Lernergebnisse

Die Studierenden erhalten einen Überblick über die modernen Methoden des Data Science in den Ingenieurwissenschaften mit einem Fokus auf der chemischen Verfahrenstechnik. Die Studierenden kennen die grundlegenden Methoden der Datenvorbehandlung, der Feature-Extraktion und können diese anwenden. Nach Abschluss des Moduls haben die Studierenden einen Überblick über die Methoden zur daten-getriebenen Modellierung, Trainingsverfahren des maschinellen Lernens und können diese anhand frei verfügbarer Frameworks eigenständig auf verfahrenstechnische Beispiele anwenden.

Lehrinhalte

Behandelt werden (i) die Grundlagen zur Datenvorbehandlung wie Multikollinearität, Lineare Abhängigkeiten, Imputation fehlender Werte, Anomaliedetektion, Umgang mit Ausreißern, (ii) Methoden zur Feature-Selektion und -Extraktion zum Beispiel unter Nutzung von Stepwise Variable Selection, Lasso, L1-Regularisierung, BoxCox Transformation, PCA und PLS, (iii) basierend darauf werden überwachte und unüberwachte Methoden des maschinellen Lernens eingeführt, um Klassifikations- und Regressionsprobleme zu lösen, (iv) neben linearen Methoden werden auch nichtlineare Methoden eingeführt wie Random Forst, Support Vector Machines und neuronale Netze. Die Methoden werden anhand von Beispielen aus dem Chemieingenieurwesen bzw. der Verfahrenstechnik erläutert und die Beispiele den Studierenden zur Verfügung gestellt. Zur Anwendung kommen Softwareframeworks in R (R Kenntnisse sind keine Voraussetzung, s.u.)

Modulbestandteile

Arbeitsaufwand und Leistungspunkte

Lehrveranstaltungsunabhängiger Aufwand:

AufwandbeschreibungMultiplikatorStundenGesamt
Klausurvorbereitung1.015.0h15.0h
Präsenz in der Vorlesung1.015.0h15.0h
Projekt Data Science1.030.0h30.0h
Vor- und Nachbereitung1.015.0h15.0h
75.0h(~3 LP)
Der Aufwand des Moduls summiert sich zu 75.0 Stunden. Damit umfasst das Modul 3 Leistungspunkte.

Beschreibung der Lehr- und Lernformen

Die Lehrveranstaltung findet als wöchentliche Onlinevorlesung mit in der Vorlesung integrierten Übungseinheiten statt. Vor den Übungseinheiten werden den Studierenden entsprechende Anwendungsbeispiele als rechnergestützte Aufgaben zur selbstständigen Bearbeitung zur Verfügung gestellt und die Ergebnisse in kleinen Gruppen besprochen.

Voraussetzungen für die Teilnahme / Prüfung

Wünschenswerte Voraussetzungen für die Teilnahme an den Lehrveranstaltungen:

Dieses Modul wird empfohlen für Masterstudierende in Energie- und Verfahrenstechnik, Chemieingenieurwesen, Regenerative Enegiesysteme, Process Energy and Environmental Systems Engineering, Informationstechnik im Maschinenwesen, Informatik und Physik. Es gibt keine formalen Voraussetzungen zur Teilnahme. Zu Beginn wird eine kurze Einführung in R gegeben, so dass keine Vorkenntnisse in R notwendig sind. Grundsätzliche Programmiervorkenntnis z.B. in Matlab sind aber notwendig. Es wird empfohlen zuvor folgenden Lehrveranstaltungen zu absolvieren: - Analysis I und II sowie Lineare Algebra für Ingenieure - Numerische Methoden für Ingenieure - Grundlagen der Programmierung / Informatik für Ingenieure

Verpflichtende Voraussetzungen für die Modulprüfungsanmeldung:

Dieses Modul hat keine Prüfungsvoraussetzungen.

Abschluss des Moduls

Benotung

Benotet

Prüfungsform

Portfolioprüfung

Art der Portfolioprüfung

100 Punkte insgesamt

Sprache(n)

Deutsch

Prüfungselemente

NamePunkteKategorieDauer/Umfang
mündliche Rücksprache20mündlichKeine Angabe
Programmierprojekt80praktischKeine Angabe

Notenschlüssel

Notenschlüssel »Notenschlüssel 5: Fak III (1)«

Gesamtpunktzahl1.01.31.72.02.32.73.03.33.74.0
100.0pt95.0pt92.0pt89.0pt86.0pt83.0pt80.0pt77.0pt74.0pt71.0pt68.0pt

Prüfungsbeschreibung (Abschluss des Moduls)

Eigenständiges Programmierprojekt

Dauer des Moduls

Für Belegung und Abschluss des Moduls ist folgende Semesteranzahl veranschlagt:
1 Semester.

Dieses Modul kann in folgenden Semestern begonnen werden:
Winter- und Sommersemester.

Maximale teilnehmende Personen

Die maximale Teilnehmerzahl beträgt 20.

Anmeldeformalitäten

Die Anmeldung erfolgt über das Sekretariat KWT 9 mit den üblichen Anmeldeformularen für Wahl- und Zusatzmodule in Papierform.

Literaturhinweise, Skripte

Skript in Papierform

Verfügbarkeit:  verfügbar

 

Skript in elektronischer Form

Verfügbarkeit:  verfügbar

 

Literatur

Empfohlene Literatur
Applied predictive modelling (Kjell Johnson und Max Kuhn)
Elements of statistical learning (Jerome Friedman et al.)
Introduction to statistical learning (Gareth James et al.)

Zugeordnete Studiengänge


Diese Modulversion wird in folgenden Studiengängen verwendet:

Studiengang / StuPOStuPOsVerwendungenErste VerwendungLetzte Verwendung
Dieses Modul findet in keinem Studiengang Verwendung.

Sonstiges

Keine Angabe