Zur Modulseite PDF generieren

#41213 / #2

Seit WiSe 2024/25

Deutsch, Englisch

Data Integration: Algorithms and Systems

6

Abedjan, Ziawasch

Benotet

Mündliche Prüfung

Englisch

Zugehörigkeit


Fakultät IV

Institut für Softwaretechnik und Theoretische Informatik

34353400 FG Data Integration and Data Preparation

Keine Angabe

Kontakt


TEL 11

Abedjan, Ziawasch

abedjan@tu-berlin.de

Lernergebnisse

„Data integration is the 800-pound gorilla in the corner, and everyone’s got it in spades“, so Mike Stonebraker, MIT-Professor und Turing-Preisträger. Die herausfordernde und zeitaufwändige Aufgabe von Datenwissenschaftlern im Zeitalter von Big Data besteht darin, Daten aus verschiedenen Quellen zu konsolidieren und so schmutzige Daten, Heterogenität in der Datendarstellung und Unvollständigkeit der Daten zu überwinden. In diesem Kurs werden wir die gesamte Pipeline eines Informationsintegrationsworkflows erläutern, indem wir uns mit bestehenden Integrationsarchitekturen, Algorithmen für die Datenbereinigung, dem Schemaabgleich und der Datenfusion befassen. Darüber hinaus werden wir modernste Systeme und prominente Anwendungsfälle von Informationsintegrationstechniken diskutieren.

Lehrinhalte

Der Kurs hat folgende Schwerpunktthemen: -Verteilung und Autonomie -Grundlagen der Datenintegration - Architekturen (Data Warehouses, föderierte Datenbanken) -String-Matching -Schema-Matching/Mapping - Global-as-View- und Lokal-as-View-Modellierung -Datenbereinigung -Duplikaterkennung -Datenqualität -Datenprofiing

Modulbestandteile

Pflichtbereich

Die folgenden Veranstaltungen sind für das Modul obligatorisch:

LehrveranstaltungenArtNummerTurnusSpracheSWS ISIS VVZ
Data Integration: Algorithms and SystemsTUTWiSeen1
Data Integration: Algorithms and SystemsVLWiSeen3

Arbeitsaufwand und Leistungspunkte

Data Integration: Algorithms and Systems (TUT):

AufwandbeschreibungMultiplikatorStundenGesamt
Präsenzzeit15.01.0h15.0h
Vor-/Nachbereitung15.03.0h45.0h
60.0h(~2 LP)

Data Integration: Algorithms and Systems (VL):

AufwandbeschreibungMultiplikatorStundenGesamt
Präsenzzeit1.02.0h2.0h
Prüfung15.03.0h45.0h
Vor-/Nachbereitung15.03.0h45.0h
92.0h(~4 LP)
Der Aufwand des Moduls summiert sich zu 152.0 Stunden. Damit umfasst das Modul 6 Leistungspunkte.

Beschreibung der Lehr- und Lernformen

Vorlesung und Tutorium

Voraussetzungen für die Teilnahme / Prüfung

Wünschenswerte Voraussetzungen für die Teilnahme an den Lehrveranstaltungen:

Erfolgreicher Abschluss von Grundlagenveranstaltungen in Datenbanken (ISDA) und Maschinelles Lernen

Verpflichtende Voraussetzungen für die Modulprüfungsanmeldung:

Voraussetzung
Leistungsnachweis »[D2IP] Passing the exercise«

Abschluss des Moduls

Benotung

Benotet

Prüfungsform

Mündliche Prüfung

Sprache(n)

Deutsch, Englisch

Dauer/Umfang

20 Minuten

Dauer des Moduls

Für Belegung und Abschluss des Moduls ist folgende Semesteranzahl veranschlagt:
1 Semester.

Dieses Modul kann in folgenden Semestern begonnen werden:
Wintersemester.

Maximale teilnehmende Personen

Die maximale Teilnehmerzahl beträgt 60.

Anmeldeformalitäten

Wird auf ISIS angekündigt.

Literaturhinweise, Skripte

Skript in Papierform

Verfügbarkeit:  nicht verfügbar

 

Skript in elektronischer Form

Verfügbarkeit:  nicht verfügbar

 

Literatur

Empfohlene Literatur
https://www.assets.dpunkt.de/openbooks/informationsintegration.pdf
https://www.sciencedirect.com/book/9780124160446/principles-of-data-integration

Zugeordnete Studiengänge


Diese Modulversion wird in folgenden Studiengängen verwendet:

Studiengang / StuPOStuPOsVerwendungenErste VerwendungLetzte Verwendung
Computer Engineering (M. Sc.)18WiSe 2024/25SoSe 2025
Computer Science (Informatik) (M. Sc.)110WiSe 2024/25SoSe 2025
Elektrotechnik (M. Sc.)16WiSe 2024/25SoSe 2025
Information Systems Management (Wirtschaftsinformatik) (M. Sc.)16WiSe 2024/25SoSe 2025
Wirtschaftsingenieurwesen (M. Sc.)12WiSe 2024/25SoSe 2025

Sonstiges

Keine Angabe