Zur Modulseite PDF generieren

#40494 / #10

Seit SoSe 2024

Deutsch, Englisch

BDSPRO Big Data Systems Project

9

Markl, Volker

Benotet

Portfolioprüfung

Englisch

Zugehörigkeit


Fakultät IV

Institut für Softwaretechnik und Theoretische Informatik

34351500 FG Datenbanksysteme und Informationsmanagement (DIMA)

Keine Angabe

Kontakt


EN 7

Soto, Juan

sekr@dima.tu-berlin.de

Lernergebnisse

In diesem Modul lernen die Studierenden, eine aktuelle Fragestellung aus dem Bereich des Big Data Management systematisch zu analysieren sowie eine problemorientierte Lösung im Team zu entwickeln und umzusetzen. Die Studierenden lernen, als Teammitglieder zu kooperieren, zur Projektorganisation, Qualitätssicherung und Dokumentation beizutragen und die Qualität ihrer Lösung durch Analyse, systematische Experimente und Testfälle zu bewerten. Mit Abschluss des Moduls sind die Studierenden in der Lage, die Architektur großer Datensysteme zu verstehen und Probleme zu lösen, die sich hinter dem End-to-End-Design, der Implementierung und dem Testen großer Datenverwaltungssysteme verbergen. Sie werden in der Lage sein, im Team Lösungen zu entwerfen und zu implementieren, um die Leistung und den Funktionsumfang von großen Datensystemen zu verbessern.

Lehrinhalte

Sowohl Wissenschaft als auch Industrie befinden sich derzeit in einem tiefgreifenden Wandel: Große, vielfältige Datensätze - erstellt von Sensoren des Internet-of-Things, dem Internet selbst oder über Crowd Sourcing - bieten eine riesige Chance für datengestützte Entscheidungsfindung. Diese Daten bergen neue Herausforderungen: in Bezug auf ihr noch nie dagewesenes Volumen, die Geschwindigkeit, mit der sie erzeugt werden, und die Vielfalt der Datenquellen, die integriert werden müssen. Der Bereich der Big-Data-Systeme befasst sich mit den technologischen Mitteln zur Verarbeitung großer Datenmengen mit dem Ziel des Erkenntnisgewinns aus den Daten. Es wurde eine ganze Reihe neuer Systeme und Paradigmen entwickelt, um diese Herausforderungen zu bewältigen. Allerdings erfüllen die derzeitigen Systeme noch immer nicht alle Anforderungen der Nutzer. Daher muss an den Systemen weiter geforscht werden, um in jedem Szenario eine robuste Abfrageleistung zu erzielen. In diesem Modul führen die Studierenden Projekte durch, welche sich mit Themen befassen, die mit aktuellen Trends im Datenmanagement zusammenhängen, wie z. B. modern Hardware, zustandsorientiertes Data Streams Management, Sensordatenmanagement, Compilertechnologie, Abfrageoptimierung und maschinelles Lernen für Datenbanken. Der Umfang des Projekts wird an die tatsächliche Gruppengröße angepasst, um die Gesamtarbeitsbelastung des Kurses widerzuspiegeln (d.h. 270h Arbeit pro Person). Währenddessen lernen die Studierenden die Algorithmen, das Systemdesign und die tatsächliche Implementierung der so genannten Distributed Processing Platforms (z.B. Flink, NebulaStream, Spark) kennern. Dabei handelt es sich um Systeme, die parallele Berechnungen auf Terabytes von Daten auf Clustern sowie verteilten Internet-of-Things-Topologien von bis zu mehreren tausend Maschinen durchführen. Zu Beginn des Projekts erhält jede*r Student*in ein Thema sowie einige Informationsmaterialien. Das Team entscheidet sich mit Unterstützung der*der Dozierenden für eine Projektumgebung und wählt geeignete Werkzeugen für Teamarbeit, Projektkommunikation, Entwicklung und Testing. Als Nächstes wird das Problem analysiert, modelliert und in einzelne Komponenten zerlegt, aus denen Aufgaben abgeleitet werden, die anschließend an kleinere Teams oder Einzelpersonen vergeben werden. In wöchentlichen Projektbesprechungen stellt das Projektteam die Fortschritte und erreichten Meilensteine vor. In Absprache mit dem Dozierenden wird entschieden, welche Schritte als nächstes unternehmen sind. Das Projekt wird mit einer Abschlusspräsentation abgeschlossen, die eine Demonstration des Prototypen beinhaltet.

Modulbestandteile

Pflichtbereich

Die folgenden Veranstaltungen sind für das Modul obligatorisch:

LehrveranstaltungenArtNummerTurnusSpracheSWS ISIS VVZ
BDAPRO - Big Data Analytics ProjectPJ0434 L 484WiSe/SoSeKeine Angabe6

Arbeitsaufwand und Leistungspunkte

BDAPRO - Big Data Analytics Project (PJ):

AufwandbeschreibungMultiplikatorStundenGesamt
Vorbereitung und Designphase1.040.0h40.0h
Teilnahme an Teammeetings20.03.0h60.0h
Dokumentation, Präsentation1.040.0h40.0h
Implementierung, Tests, Experimente1.0130.0h130.0h
270.0h(~9 LP)
Der Aufwand des Moduls summiert sich zu 270.0 Stunden. Damit umfasst das Modul 9 Leistungspunkte.

Beschreibung der Lehr- und Lernformen

Angeleitete und selbstständige Projektarbeit.

Voraussetzungen für die Teilnahme / Prüfung

Wünschenswerte Voraussetzungen für die Teilnahme an den Lehrveranstaltungen:

Erwünschte vorausgesetzte Kenntnisse und Fähigkeiten beinhalten: (a) Allgemeine Informatik (z. B. Algorithmen, Datenstrukturen, Systemarchitektur, verteilte Systeme), erworben durch einen Bachelor-Abschluss (z. B. B.Sc. Informatik), (b) Mathematik (z. B. lineare Algebra, Statistik), (c) spezifische Teilgebiete der Informatik (z.B. Datenbanktechnologie / DBT, Datenmanagement auf moderner Hardware / DMH, Maschinelles Lernen / ML1 oder MI1, Compiler), (d) solide Programmierkenntnisse in mindestens einer der folgenden Programmiersprachen: Java, C++, Scala oder Python, (e) funktionale Programmierung, (f) Grundlagen in verteilten Quellcodeverwaltungssystemen (z.B. Git) und agilen Softwareentwicklungsprozessen, (g) DBT oder ein gleichwertiger Kurs über die Architektur von Datenbanken vor der Einschreibung in BDSPRO (andernfalls müssen Sie gleichzeitig in DBT und BDSPRO im selben Semester eingeschrieben sein).

Verpflichtende Voraussetzungen für die Modulprüfungsanmeldung:

Dieses Modul hat keine Prüfungsvoraussetzungen.

Abschluss des Moduls

Benotung

Benotet

Prüfungsform

Portfolioprüfung

Art der Portfolioprüfung

100 Punkte insgesamt

Sprache(n)

Englisch

Prüfungselemente

NamePunkteKategorieDauer/Umfang
(Lernprozessevaluation) Design und Ausführung der Experimentieranordnung20praktischca. 30h
(Ergebnisprüfung) Analyse der Experimente20praktischca. 30h
(Ergebnisprüfung) Zwischenpräsentation10mündlichca. 10-15 Minuten
(Ergebnisprüfung) Abschlusspräsentation20mündlichca. 20 Minuten
(Lernprozessevaluation) Prototyp mit Test Cases und Dokumentation30praktischca. 60h

Notenschlüssel

Notenschlüssel »Notenschlüssel 2: Fak IV (2)«

Gesamtpunktzahl1.01.31.72.02.32.73.03.33.74.0
100.0pt95.0pt90.0pt85.0pt80.0pt75.0pt70.0pt65.0pt60.0pt55.0pt50.0pt

Prüfungsbeschreibung (Abschluss des Moduls)

Die studierenden werden individuell bewertet. Das heißt, die Note hängt von der persönlich erbrachten Leistung der Studierenden ab. Die Gesamtnote gemäß § 68 (2) AllgStuPO wird nach dem Notenschlüssel 2 der Fakultät IV ermittelt.

Dauer des Moduls

Für Belegung und Abschluss des Moduls ist folgende Semesteranzahl veranschlagt:
1 Semester.

Dieses Modul kann in folgenden Semestern begonnen werden:
Winter- und Sommersemester.

Maximale teilnehmende Personen

Die maximale Teilnehmerzahl beträgt 12.

Anmeldeformalitäten

Zum Besuch der Lehrveranstaltung ist eine Zulassung erforderlich. Bitte informieren Sie sich vor Beginn der Vorlesungszeit auf https://www.tu.berlin/dima/studium-lehre/kursangebote , um nähere Informationen zum Anmeldeprozess zu erhalten.

Literaturhinweise, Skripte

Skript in Papierform

Verfügbarkeit:  nicht verfügbar

 

Skript in elektronischer Form

Verfügbarkeit:  nicht verfügbar

 

Literatur

Empfohlene Literatur
Project specific literature will be announced in the first lecture.

Zugeordnete Studiengänge


Diese Modulversion wird in folgenden Studiengängen verwendet:

Studiengang / StuPOStuPOsVerwendungenErste VerwendungLetzte Verwendung
Computer Engineering (M. Sc.)16SoSe 2024SoSe 2025
Computer Science (Informatik) (M. Sc.)19SoSe 2024SoSe 2025
Elektrotechnik (M. Sc.)16SoSe 2024SoSe 2025
ICT Innovation (M. Sc.)13SoSe 2024SoSe 2025
Information Systems Management (Wirtschaftsinformatik) (M. Sc.)16SoSe 2024SoSe 2025
Medieninformatik (M. Sc.)13SoSe 2024SoSe 2025
Medientechnik (M. Sc.)16SoSe 2024SoSe 2025
Wirtschaftsingenieurwesen (M. Sc.)13SoSe 2024SoSe 2025
Keine Angabe

Sonstiges

Keine Angabe