Lernergebnisse
„Data integration is the 800-pound gorilla in the corner, and everyone’s got it in spades“, so Mike Stonebraker, MIT-Professor und Turing-Preisträger. Die herausfordernde und zeitaufwändige Aufgabe von Datenwissenschaftlern im Zeitalter von Big Data besteht darin, Daten aus verschiedenen Quellen zu konsolidieren und so schmutzige Daten, Heterogenität in der Datendarstellung und Unvollständigkeit der Daten zu überwinden. In diesem Kurs werden wir die gesamte Pipeline eines Informationsintegrationsworkflows erläutern, indem wir uns mit bestehenden Integrationsarchitekturen, Algorithmen für die Datenbereinigung, dem Schemaabgleich und der Datenfusion befassen. Darüber hinaus werden wir modernste Systeme und prominente Anwendungsfälle von Informationsintegrationstechniken diskutieren.