Zur Modulseite PDF generieren

#40310 / #5

SoSe 2020 - WiSe 2021/22

English

Advanced Information Management 2 - Management of Data Streams

6

Markl, Volker

Benotet

Portfolioprüfung

English

Zugehörigkeit


Fakultät IV

Institut für Softwaretechnik und Theoretische Informatik

34351500 FG Datenbanksysteme und Informationsmanagement (DIMA)

Keine Angabe

Kontakt


EN 7

Borusan, Alexander

sekr@dima.tu-berlin.de

Lernergebnisse

Through the technological advances in the last few years more and more applications are being created that constantly generate data which is only relevant for a certain time frame. Because of this, this type of application has to be able to handle various streams of data. You will gain conceptual, methodological and practical skills in the area of processing data streams, by using examples from various application areas.

Lehrinhalte

In recent years, advances in hardware technology have facilitated new ways of collecting data continuously. In many applications such as for instance network monitoring, the volume of such data is so large that it may be impossible to store the data on disk. Furthemore, even when the data can be stored, the volume of the incoming data may be so large that it may be impossible to process any particular record more than once. Therefore, many database operations and data analysis algorithms such as for instance filtering, indexing, classification and clustering become significantly more challenging in this context. The course has the following main topics: - Basic conceptual understanding and terminology of data streams management, introduction to data streams, the difference to classical data management, examples (telephone networks, automotive electronics, avionics, medical, transport management, building monitoring, etc.) - Basic concepts of technical information systems, modeling of data streams - Data sources, requirements elicitation, requirements structuring, requirements of data stream management systems (DSMS) - Reference architecture of a DSMS, architecture modeling - Modeling of the functionality, logical architecture. Description on technical architecture, interface definition, behavior modeling - Data streams processing: Windowing, The Sliding-Window Computation Model and Results - Synopsis Construction in Data Streams (Sampling, Wavelets, Sketches and Histograms) - Filtering, counting in data streams - Data streams analysis: Classification & Clustering - Data processing in sensor networks, resource utilization, transmission and transfer costs - Modeling examples (automotive electronics, avionics). Prototype Systems (Aurora, STREAM, TelegraphCQ). Frameworks (Flink, Spark, Storm, Samza, SAMOA)

Modulbestandteile

Compulsory area

Die folgenden Veranstaltungen sind für das Modul obligatorisch:

LehrveranstaltungenArtNummerTurnusSpracheSWS ISIS VVZ
Advanced Information Management 2 - Management of Data StreamsIV0434 L 471WiSeen4

Arbeitsaufwand und Leistungspunkte

Advanced Information Management 2 - Management of Data Streams (IV):

AufwandbeschreibungMultiplikatorStundenGesamt
Lecture15.02.0h30.0h
Labs / Project Work15.04.0h60.0h
Study of Materials15.02.0h30.0h
Seminar Presentations + Reporting15.04.0h60.0h
180.0h(~6 LP)
Der Aufwand des Moduls summiert sich zu 180.0 Stunden. Damit umfasst das Modul 6 Leistungspunkte.

Beschreibung der Lehr- und Lernformen

AIM-2 (Advanced Information Management 2 - Management of Data Streams) consists of 4 teaching elements: lectures, in parallel integrated phases of student presentations (individual work) and labs work (group projects plus home work), plus intensive study of literature.

Voraussetzungen für die Teilnahme / Prüfung

Wünschenswerte Voraussetzungen für die Teilnahme an den Lehrveranstaltungen:

BSc in Computer Science / Computer Engineering (or similar); good knowledge in 'Databases & Information Systems', 'Software Engineering', and Mathematics

Verpflichtende Voraussetzungen für die Modulprüfungsanmeldung:

Dieses Modul hat keine Prüfungsvoraussetzungen.

Abschluss des Moduls

Benotung

Benotet

Prüfungsform

Portfolio examination

Art der Portfolioprüfung

100 Punkte insgesamt

Sprache(n)

English

Prüfungselemente

NamePunkteKategorieDauer/Umfang
Project Work/Homework (small teams = 3 max)20praktisch30 hours
Seminar Talk (individual)30mündlich20-30 minutes
Written Project Report35schriftlich20 pages
Written Seminar Report (individual)15schriftlich8-10 pages

Notenschlüssel

Notenschlüssel »Notenschlüssel 2: Fak IV (2)«

Gesamtpunktzahl1.01.31.72.02.32.73.03.33.74.0
100.0pt95.0pt90.0pt85.0pt80.0pt75.0pt70.0pt65.0pt60.0pt55.0pt50.0pt

Prüfungsbeschreibung (Abschluss des Moduls)

The exam of this module consists of 4 portfolio elements: 3 'deliverable assessements' ("Ergebnisprüfungen"): seminar talk, seminar report, and project report plus one 'learning process review' ("Lernprozess-Evaluierung"): project (lab & home) work evaluation

Dauer des Moduls

Für Belegung und Abschluss des Moduls ist folgende Semesteranzahl veranschlagt:
1 Semester.

Dieses Modul kann in folgenden Semestern begonnen werden:
Wintersemester.

Maximale teilnehmende Personen

Die maximale Teilnehmerzahl beträgt 30.

Anmeldeformalitäten

Before semester start, you must announce your interest to the "DIMA Anmeldetool" ('DIMA pre-semester registration tool')! Within 6 weeks after commencement of the class (but before the first result is to be delivered), you must offiicially register in QISPOS (TUB examination protocol system')

Literaturhinweise, Skripte

Skript in Papierform

Verfügbarkeit:  nicht verfügbar

 

Skript in elektronischer Form

Verfügbarkeit:  nicht verfügbar

 

Literatur

Empfohlene Literatur
Data Streams: Models and Algorithms. Ed. by Charu C. Aggarwal, Springer, 2007 als Basisliteratur, daneben zu jedem Themenkomplex klassische und aktuelle Forschungspapiere.
J. Leskovec, A.Rajaraman, J.D.Ullman. Mining of Massive Data Sets. Cambridge University Press. 2014, ISBN: 9781107077232

Zugeordnete Studiengänge


Diese Modulversion wird in folgenden Studiengängen verwendet:

Studiengang / StuPOStuPOsVerwendungenErste VerwendungLetzte Verwendung
Dieses Modul findet in keinem Studiengang Verwendung.

Sonstiges

Keine Angabe