Zur Modulseite PDF generieren

#41135 / #5

Seit SoSe 2024

Deutsch, Englisch

ROC Foundations for Graduate Research in Data Management and Machine Learning Systems

9

Markl, Volker

Benotet

Portfolioprüfung

Englisch

Zugehörigkeit


Fakultät IV

Institut für Softwaretechnik und Theoretische Informatik

34351500 FG Datenbanksysteme und Informationsmanagement (DIMA)

Keine Angabe

Kontakt


EN 7

Markl, Volker

sekr@dima.tu-berlin.de

Lernergebnisse

Big Data und maschinelles Lernen sind die wichtigsten Treiber für die aktuelle Innovationswelle in den Bereichen künstliche Intelligenz und Datenwissenschaft. Diese Treiber haben tiefgreifende Auswirkungen sowohl auf die Wirtschaft als auch auf die Wissenschaft gehabt. Dieser Kurs richtet sich an Studierende mit Forschungsinteresse, die eine Promotion in Big Data Management oder Data Science and Engineering Systems/Technologies anstreben. Nach Abschluss dieses Kurses sind die die Studierenden in der Lage, die Contemporary Research Method, einschließlich wissenschaftlichem Lesen, Schreiben, Präsentieren, Prototyping und Versuchsplanung anzuwenden. Außerdem haben sie sowohl theoretische als auch praktische Fähigkeiten in Datenmanagement und Big-Data-Technologien erworben und sind auf die heutigen großen Forschungsherausforderungen im Bereich skalierbares Datenmanagement und -verarbeitung vorbereitet. Der Kurs vermittelt vor allem technische Fähigkeiten (20%), methodische Fähigkeiten (40%), Systemfähigkeiten (20%) und soziale Fähigkeiten (20%).

Lehrinhalte

Der zentrale Fokus dieses Moduls liegt auf der Contemporary Research Method (CRM), Datenmanagementtechnologien und aktuellen Forschungsherausforderungen. Nach einer anfänglichen Präsentation über CRM, einschließlich wissenschaftlichem Lesen, Schreiben, Präsentieren, Prototyping und experimentellem Design, lesen die Studierenden in den folgenden Vorlesungen über grundlegende Datenmanagement-Methoden/-Technologien und bieten eine Präsentation an, auf die dann eine vom Dozenten geleitete Präsentation zu verwandten fortgeschrittenen Themen folgt. Zu den Diskussionsthemen gehören Datenspeicherung und Indexierung, Spezifikation und Kompilierung von Datenanalyseprogrammen, Abfrageoptimierung und Selbstoptimierung, adaptive Methoden, Verarbeitung von Data Science Pipelines sowie verantwortungsvolles Datenmanagement. In einer begleitenden Laborkomponente werden die Studierenden die besprochenen Methoden, Technologien und Einstellungen in einer methodischen und wissenschaftlichen Weise prototypisieren und bewerten und einen wissenschaftlichen Bericht über ihre Ergebnisse erstellen.

Modulbestandteile

Pflichtbereich

Die folgenden Veranstaltungen sind für das Modul obligatorisch:

LehrveranstaltungenArtNummerTurnusSpracheSWS ISIS VVZ
ROC-PRO Project on the Foundations for Graduate Research in Data Management and Machine Learning SystemsPJWiSeen4
ROC-SEM Seminar on the Foundations for Graduate Research in Data Management and Machine Learning SystemsSEMWiSeen2

Arbeitsaufwand und Leistungspunkte

ROC-PRO Project on the Foundations for Graduate Research in Data Management and Machine Learning Systems (PJ):

AufwandbeschreibungMultiplikatorStundenGesamt
Präsenzzeit15.02.0h30.0h
Vor-/Nachbereitung15.02.0h30.0h
Lab course (Programming)15.02.0h30.0h
Lab Course (System Setup)15.04.0h60.0h
Report15.02.0h30.0h
180.0h(~6 LP)

ROC-SEM Seminar on the Foundations for Graduate Research in Data Management and Machine Learning Systems (SEM):

AufwandbeschreibungMultiplikatorStundenGesamt
Präsenzzeit15.04.0h60.0h
Vor-/Nachbereitung15.02.0h30.0h
90.0h(~3 LP)
Der Aufwand des Moduls summiert sich zu 270.0 Stunden. Damit umfasst das Modul 9 Leistungspunkte.

Beschreibung der Lehr- und Lernformen

(a) Vorlesungen zu Schlüsselkonzepten, (b) Diskussionen, (c) Präsentationen unter der Leitung von Studierenden (einschließlich Literaturrecherche) und (d) ein Systemforschungsprojekt mit Systemaufbau, Prototyping, Versuchsplanung, Leistungsbewertung und (e) Erstellung einer Präsentation und eines Berichts über die Ergebnisse. Eine aktive Teilnahme und Beiträge zu allen Teilen des Moduls sind unerlässlich.

Voraussetzungen für die Teilnahme / Prüfung

Wünschenswerte Voraussetzungen für die Teilnahme an den Lehrveranstaltungen:

Folgende Kenntnisse und Fähigkeiten werden vorausgesetzt: (a) Themen der Informatik, die in den Modulen des Bachelor-Studiengangs der TU Berlin behandelt werden, insbesondere ISDA (Informationssysteme und Datenanalyse) und DBPRA (Praktisches Datenbanksystemlabor) oder äquivalente Module, (b) gute Programmierkenntnisse in C, Java und SQL. (c) ein Grundstudium in linearer Algebra, Wahrscheinlichkeitsrechnung und Statistik. (d) Kenntnisse aus den Mastermodule Database Technoloy (DBT) und Advanced Information Management (z. B. MDS, DMH). (e) gute Englischkenntnisse.

Verpflichtende Voraussetzungen für die Modulprüfungsanmeldung:

Dieses Modul hat keine Prüfungsvoraussetzungen.

Abschluss des Moduls

Benotung

Benotet

Prüfungsform

Portfolioprüfung

Art der Portfolioprüfung

100 Punkte insgesamt

Sprache(n)

Englisch

Prüfungselemente

NamePunkteKategorieDauer/Umfang
(Ergebnisprüfung) Technologiepräsentation (SEM)15mündlich20 Minuten + 10 Minuten Diskussion (20 Folien)
(Punktuelle Leistungsabfrage) Schriftlicher Test zu Datenbanktechnologien und wissenschaftlichem Arbeiten (SEM)25schriftlich60 Minuten
(Ergebnisprüfung) Benchmarkingprojekt-Präsentation (PRO)25mündlich20 Minuten + 10 Minuten Diskussion
(Lernprozessevaluation) Interaktion mit der*dem Mentor*in5flexibel30 bis 60 Minuten je nach Bedarf
(Lernprozessevaluation) Evaluationsbericht (PRO)30schriftlich8 Seiten im Konferenz-Stil

Notenschlüssel

Notenschlüssel »Notenschlüssel 2: Fak IV (2)«

Gesamtpunktzahl1.01.31.72.02.32.73.03.33.74.0
100.0pt95.0pt90.0pt85.0pt80.0pt75.0pt70.0pt65.0pt60.0pt55.0pt50.0pt

Prüfungsbeschreibung (Abschluss des Moduls)

Die Gesamtnote gemäß § 68 (2) AllgStuPO wird nach dem Notenschlüssel 2 der Fakultät IV ermittelt.

Dauer des Moduls

Für Belegung und Abschluss des Moduls ist folgende Semesteranzahl veranschlagt:
1 Semester.

Dieses Modul kann in folgenden Semestern begonnen werden:
Wintersemester.

Maximale teilnehmende Personen

Die maximale Teilnehmerzahl beträgt 8.

Anmeldeformalitäten

Zum Besuch der Lehrveranstaltung ist eine Zulassung erforderlich. Bitte informieren Sie sich vor Beginn des Semesters auf https://www.tu.berlin/dima/studium-lehre/kursangebote , um nähere Informationen zum Anmeldeprozess zu erhalten.

Literaturhinweise, Skripte

Skript in Papierform

Verfügbarkeit:  nicht verfügbar

 

Skript in elektronischer Form

Verfügbarkeit:  nicht verfügbar

 

Literatur

Empfohlene Literatur
Readings in Database Systems, 5th Edition, Peter Bailis, Joseph M. Hellerstein, Michael Stonebraker, editors, http://www.redbook.io/
Various Research Papers, made available during the first lecture
Hadoop: The Definitive Guide (4th Edition), Tom White, O’Reilly Media, 2015.
Raj Jain: The Art of Computer Systems Performance Analysis: Techniques for Experimental Design, Measurement, Simulation, and Modeling (Wiley Professional Computing), 1991
Supplementary reading material may be assigned to complement course lectures.

Zugeordnete Studiengänge


Diese Modulversion wird in folgenden Studiengängen verwendet:

Studiengang / StuPOStuPOsVerwendungenErste VerwendungLetzte Verwendung
Computer Engineering (M. Sc.)16SoSe 2024SoSe 2025
Computer Science (Informatik) (M. Sc.)19SoSe 2024SoSe 2025
Elektrotechnik (M. Sc.)16SoSe 2024SoSe 2025
Informatik (B. Sc.)13SoSe 2024SoSe 2025
Information Systems Management (Wirtschaftsinformatik) (M. Sc.)16SoSe 2024SoSe 2025
Dieser Kurs richtet sich an forschungsorientierte Bachelor- und Masterstudierende, die sich mit Datenbanksystemen und Informationsmanagement in den Studiengängen Informatik (Schwerpunkt Systems Engineering), Technische Informatik (Schwerpunkt: Information Systems and Software Engineering) und Wirtschaftsingenieurwesen befassen wollen, sowie an Studenten, die den Data Science and Engineering Master's Track absolvieren.

Sonstiges

Keine Angabe