Zur Modulseite PDF generieren

#40494 / #11

Seit SoSe 2026

Deutsch, Englisch

BDSPRO Big Data Systems Project

9

Markl, Volker

Benotet

Portfolioprüfung

Englisch

Zugehörigkeit


Fakultät IV

Institut für Softwaretechnik und Theoretische Informatik

34351500 FG Datenbanksysteme und Informationsmanagement (DIMA)

Keine Angabe

Kontakt


EN 7

Soto, Juan

sekr@dima.tu-berlin.de

Lernergebnisse

In diesem Modul lernen die Studierenden, eine aktuelle Fragestellung aus dem Bereich des Big Data Management systematisch zu analysieren sowie eine problemorientierte Lösung im Team zu entwickeln und umzusetzen. Die Studierenden lernen, als Teammitglieder zu kooperieren, zur Projektorganisation, Qualitätssicherung und Dokumentation beizutragen und die Qualität ihrer Lösung durch Analyse, systematische Experimente und Testfälle zu bewerten. Mit Abschluss des Moduls sind die Studierenden in der Lage, die Architektur großer Datensysteme zu verstehen und Probleme zu lösen, die sich hinter dem End-to-End-Design, der Implementierung und dem Testen großer Datenverwaltungssysteme verbergen. Sie werden in der Lage sein, im Team Lösungen zu entwerfen und zu implementieren, um die Leistung und den Funktionsumfang von großen Datensystemen zu verbessern.

Lehrinhalte

Sowohl Wissenschaft als auch Industrie befinden sich derzeit in einem tiefgreifenden Wandel: Große, vielfältige Datensätze - erstellt von Sensoren des Internet-of-Things, dem Internet selbst oder über Crowd Sourcing - bieten eine riesige Chance für datengestützte Entscheidungsfindung. Diese Daten bergen neue Herausforderungen: in Bezug auf ihr noch nie dagewesenes Volumen, die Geschwindigkeit, mit der sie erzeugt werden, und die Vielfalt der Datenquellen, die integriert werden müssen. Der Bereich der Big-Data-Systeme befasst sich mit den technologischen Mitteln zur Verarbeitung großer Datenmengen mit dem Ziel des Erkenntnisgewinns aus den Daten. Es wurde eine ganze Reihe neuer Systeme und Paradigmen entwickelt, um diese Herausforderungen zu bewältigen. Allerdings erfüllen die derzeitigen Systeme noch immer nicht alle Anforderungen der Nutzer. Daher muss an den Systemen weiter geforscht werden, um in jedem Szenario eine robuste Abfrageleistung zu erzielen. In diesem Modul führen die Studierenden Projekte durch, welche sich mit Themen befassen, die mit aktuellen Trends im Datenmanagement zusammenhängen, wie z. B. modern Hardware, zustandsorientiertes Data Streams Management, Sensordatenmanagement, Compilertechnologie, Abfrageoptimierung und maschinelles Lernen für Datenbanken. Der Umfang des Projekts wird an die tatsächliche Gruppengröße angepasst, um die Gesamtarbeitsbelastung des Kurses widerzuspiegeln (d.h. 270h Arbeit pro Person). Währenddessen lernen die Studierenden die Algorithmen, das Systemdesign und die tatsächliche Implementierung der so genannten Distributed Processing Platforms (z.B. Flink, NebulaStream, Spark) kennern. Dabei handelt es sich um Systeme, die parallele Berechnungen auf Terabytes von Daten auf Clustern sowie verteilten Internet-of-Things-Topologien von bis zu mehreren tausend Maschinen durchführen. Zu Beginn des Projekts erhält jede*r Student*in ein Thema sowie einige Informationsmaterialien. Das Team entscheidet sich mit Unterstützung der*der Dozierenden für eine Projektumgebung und wählt geeignete Werkzeugen für Teamarbeit, Projektkommunikation, Entwicklung und Testing. Als Nächstes wird das Problem analysiert, modelliert und in einzelne Komponenten zerlegt, aus denen Aufgaben abgeleitet werden, die anschließend an kleinere Teams oder Einzelpersonen vergeben werden. In wöchentlichen Projektbesprechungen stellt das Projektteam die Fortschritte und erreichten Meilensteine vor. In Absprache mit dem Dozierenden wird entschieden, welche Schritte als nächstes unternehmen sind. Das Projekt wird mit einer Abschlusspräsentation abgeschlossen, die eine Demonstration des Prototypen beinhaltet.

Modulbestandteile

Compulsory area

Die folgenden Veranstaltungen sind für das Modul obligatorisch:

LehrveranstaltungenArtNummerTurnusSpracheSWS ISIS VVZ
BDAPRO - Big Data Analytics ProjectPJ0434 L 484WiSe/SoSeKeine Angabe6

Arbeitsaufwand und Leistungspunkte

BDAPRO - Big Data Analytics Project (PJ):

AufwandbeschreibungMultiplikatorStundenGesamt
Dokumentation, Präsentation1.040.0h40.0h
Implementierung, Tests, Experimente1.0130.0h130.0h
Teilnahme an Teammeetings20.03.0h60.0h
Vorbereitung und Designphase1.040.0h40.0h
270.0h(~9 LP)
Der Aufwand des Moduls summiert sich zu 270.0 Stunden. Damit umfasst das Modul 9 Leistungspunkte.

Beschreibung der Lehr- und Lernformen

Angeleitete und selbstständige Projektarbeit.

Voraussetzungen für die Teilnahme / Prüfung

Wünschenswerte Voraussetzungen für die Teilnahme an den Lehrveranstaltungen:

Erwünschte vorausgesetzte Kenntnisse und Fähigkeiten beinhalten: (a) Allgemeine Informatik (z. B. Algorithmen, Datenstrukturen, Systemarchitektur, verteilte Systeme), erworben durch einen Bachelor-Abschluss (z. B. B.Sc. Informatik), (b) Mathematik (z. B. lineare Algebra, Statistik), (c) spezifische Teilgebiete der Informatik (z.B. Datenbanktechnologie / DBT, Datenmanagement auf moderner Hardware / DMH, Maschinelles Lernen / ML1 oder MI1, Compiler), (d) solide Programmierkenntnisse in mindestens einer der folgenden Programmiersprachen: Java, C++, Scala oder Python, (e) funktionale Programmierung, (f) Grundlagen in verteilten Quellcodeverwaltungssystemen (z.B. Git) und agilen Softwareentwicklungsprozessen, (g) DBT oder ein gleichwertiger Kurs über die Architektur von Datenbanken vor der Einschreibung in BDSPRO (andernfalls sollen Sie gleichzeitig in DBT und BDSPRO im selben Semester eingeschrieben sein).

Verpflichtende Voraussetzungen für die Modulprüfungsanmeldung:

Dieses Modul hat keine Prüfungsvoraussetzungen.

Abschluss des Moduls

Benotung

Benotet

Prüfungsform

Portfolioprüfung

Art der Portfolioprüfung

100 Punkte insgesamt

Sprache(n)

Englisch

Prüfungselemente

NamePunkteKategorieDauer/Umfang
(Learning Process Review) Experiment Design and Execution20praktischca. 30h
(Deliverable Assessment) Experiments Analysis20praktischca. 30h
(Deliverable Assessment) Intermediate Presentation10mündlichca. 10-15 Minuten
(Deliverable Assessment) Final Presentation20mündlichca. 20 Minuten
(Learning Process Review) Prototype with Test Cases and Documentation30praktischca. 60h

Notenschlüssel

Notenschlüssel »Notenschlüssel 2: Fak IV (2)«

Gesamtpunktzahl1.01.31.72.02.32.73.03.33.74.0
100.0pt95.0pt90.0pt85.0pt80.0pt75.0pt70.0pt65.0pt60.0pt55.0pt50.0pt

Prüfungsbeschreibung (Abschluss des Moduls)

Für die Portfolioelemente "Experiment Design and Execution" und "Experiments Analysis" ist ein Report im Umfang von 8-10 Seiten im VLDB double-column-Stil anzufertigen.

Dauer des Moduls

Für Belegung und Abschluss des Moduls ist folgende Semesteranzahl veranschlagt:
1 Semester.

Dieses Modul kann in folgenden Semestern begonnen werden:
Winter- und Sommersemester.

Maximale teilnehmende Personen

Die maximale Teilnehmerzahl beträgt 12.

Anmeldeformalitäten

Zum Besuch der Lehrveranstaltung ist eine Zulassung erforderlich. Bitte informieren Sie sich vor Beginn der Vorlesungszeit auf https://www.tu.berlin/dima/studium-lehre/kursangebote , um nähere Informationen zum Anmeldeprozess zu erhalten.

Literaturhinweise, Skripte

Skript in Papierform

Verfügbarkeit:  nicht verfügbar

 

Skript in elektronischer Form

Verfügbarkeit:  nicht verfügbar

 

Literatur

Empfohlene Literatur
Project specific literature will be announced in the first lecture.

Zugeordnete Studiengänge


Diese Modulversion wird in folgenden Studiengängen verwendet:

Studiengang / StuPOStuPOsVerwendungenErste VerwendungLetzte Verwendung
Computer Engineering (M. Sc.)12SoSe 2026SoSe 2026
Computer Science (Informatik) (M. Sc.)13SoSe 2026SoSe 2026
Elektrotechnik (M. Sc.)12SoSe 2026SoSe 2026
ICT Innovation (M. Sc.)11SoSe 2026SoSe 2026
Information Systems Management (Wirtschaftsinformatik) (M. Sc.)12SoSe 2026SoSe 2026
Medieninformatik (M. Sc.)11SoSe 2026SoSe 2026
Medientechnik (M. Sc.)12SoSe 2026SoSe 2026
Wirtschaftsingenieurwesen (M. Sc.)11SoSe 2026SoSe 2026
Keine Angabe

Sonstiges

Keine Angabe