Zur Modulseite PDF generieren

#41092 / #2

SoSe 2024 - WiSe 2024/25

Deutsch

Programmierpraktikum: Plattformdaten und NLP

6

Berendt, Bettina

Unbenotet

Portfolioprüfung

Deutsch

Zugehörigkeit


Fakultät IV

Institut für Telekommunikationssysteme

34332900 FG Internet und Gesellschaft

Keine Angabe

Kontakt


Keine Angabe

Staufer, Dimitri

staufer@tu-berlin.de

Lernergebnisse

Die Studierenden - sind in der Lage, Fine-Tuning von "large language models" zielgerichtet anzuwenden - kennen Konzepte und Methoden der Messung, Evaluierung und Verbesserung ausgewählter sozial relevanter Eigenschaften von Daten (z.B. Anonymität, Anonymisierung) - verfügen über ein solides Grundverständnis über Eigenschaften von Datensammlungen, welches ihnen dabei hilft, Limitationen von Forschungsvorhaben darzustellen. - kennen Methoden der Datensammlung und -beschaffung und können für ihr Vorhaben geeignete Methoden auswählen und anwenden. - kennen Methoden der Analyse von Plattformdaten und können diese auf ausgewählte Datensammlungen anwenden.

Lehrinhalte

In diesem Programmierpraktikum erwerben Studierende Grundkenntnisse in der Datensammlung und -analyse von Plattformdaten. Der Fokus liegt auf der Sammlung und Vorverarbeitung von Datensammlungen, Textmining mittels Natural Language Processing (NLP) sowie spezialisierten Themen wie der Erkennung von Voreingenommenheit (Bias) und Textanonymisierung. Die Teilnehmer*innen arbeiten in Teams, um beispielsweise Algorithmen zur Identifikation von Bias in Textdaten zu nutzen und zu entwickeln, Texte zu anonymisieren und die Auswirkungen dieser Techniken auf die Qualität der Texte zu evaluieren.

Modulbestandteile

Pflichtbereich

Die folgenden Veranstaltungen sind für das Modul obligatorisch:

LehrveranstaltungenArtNummerTurnusSpracheSWS ISIS VVZ
Plattformdaten und Natural Language ProcessingPPKSoSede4

Arbeitsaufwand und Leistungspunkte

Plattformdaten und Natural Language Processing (PPK):

AufwandbeschreibungMultiplikatorStundenGesamt
Präsenzzeit15.04.0h60.0h
Vor-/Nachbereitung15.04.0h60.0h
120.0h(~4 LP)

Lehrveranstaltungsunabhängiger Aufwand:

AufwandbeschreibungMultiplikatorStundenGesamt
Erstellung, Dokumentation und Koordination des Projekts12.05.0h60.0h
60.0h(~2 LP)
Der Aufwand des Moduls summiert sich zu 180.0 Stunden. Damit umfasst das Modul 6 Leistungspunkte.

Beschreibung der Lehr- und Lernformen

Angeleitete, selbstorganisierte Projektarbeit in Kleingruppen mit Besprechungen in den Kleingruppen und dem gesamten Kurs, Präsentationen, Meilensteinen, Methoden des Projektmanagements, sowie Anfertigen von Dokumentation über den Arbeitsprozess und die Ergebnisse.

Voraussetzungen für die Teilnahme / Prüfung

Wünschenswerte Voraussetzungen für die Teilnahme an den Lehrveranstaltungen:

* Kenntnisse aus dem Modul „Diskrete Strukturen“ oder äquivalent; * Kenntnisse aus dem Modul „Informationssysteme und Datenanalyse“ oder äquivalent; Darüber hinaus sind * gute Kenntnisse in Python oder die Bereitschaft, es schnell und selbstständig zu erlernen sowie * die Fähigkeiten und Fertigkeiten, Entwicklungsmethoden zur systematischen Herstellung von Software anzuwenden, _verpflichtende Voraussetzungen_. Wir listen diese hier unter "wünschenswerte Voraussetzungen" auf, weil wir diese Kenntnisse nicht an ein spezifisches bestandenes anderes Modul knüpfen können/wollen.

Verpflichtende Voraussetzungen für die Modulprüfungsanmeldung:

Dieses Modul hat keine Prüfungsvoraussetzungen.

Abschluss des Moduls

Benotung

Unbenotet

Prüfungsform

Portfolioprüfung

Art der Portfolioprüfung

100 Punkte insgesamt

Sprache(n)

Deutsch

Prüfungselemente

NamePunkteKategorieDauer/Umfang
(Ergebnisprüfung) Dokumentation des Projekt-Codes10praktischdem Code entsprechend
(Ergebnisprüfung) Implementierung einer Projektaufgabe10schriftlichder Aufgabe und individuellen Absprache entspechend
(Ergebnisprüfung) Projektbericht35praktischca. 10-15 Seiten
(Lernprozessevaluation) Aktive Mitarbeit bei der Erstellung des Projekt-Codes20schriftlichca. 10 Wochen, semesterbegleitend
(Lernprozessevaluation) Präsentationen und Abschlusspräsentation20schriftlich15-20 Minuten pro Präsentation
(Punktuelle Leistungsabfrage) Schriftlicher Test 15flexibel30 Minuten

Notenschlüssel

Ab insgesamt 50 Portfoliopunkten bestanden.

Prüfungsbeschreibung (Abschluss des Moduls)

Das Praktikum gilt als bestanden, wenn mindestens 50 der 100 Portfoliopunkte erreicht wurden. Es wird nicht benotet. Aktive Mitarbeit bei der Erstellung des Projekt-Codes wird gemessen an Aktivität im Git Repository der jeweiligen Kleingruppe anhand von Merge Requests, Kommentaren, Erstellung von Wikiseiten etc. Die Projektaufgabe wird in Absprache mit den Studierenden gewählt, wobei einige Themenfelder vorgegeben werden. Der Projektbericht umfasst 10-15 Seiten und enthält eine Beschreibung des verwendeten Datensatzes nach den gelernten Praktiken, eine Beschreibung der bearbeiteten Aufgabe, eine Auswertung der Daten anhand der angewendeten Methode, sowie weitere Bestandteile.

Dauer des Moduls

Für Belegung und Abschluss des Moduls ist folgende Semesteranzahl veranschlagt:
1 Semester.

Dieses Modul kann in folgenden Semestern begonnen werden:
Sommersemester.

Maximale teilnehmende Personen

Die maximale Teilnehmerzahl beträgt 15.

Anmeldeformalitäten

Die Vergabe der Plätze für das Praktikum erfolgt über den Metakurs auf ISIS. Die Anmeldeformalitäten werden zu Beginn des Semesters im ISIS-Kurs des Programmierpraktikums mitgeteilt.

Literaturhinweise, Skripte

Skript in Papierform

Verfügbarkeit:  nicht verfügbar

 

Skript in elektronischer Form

Verfügbarkeit:  nicht verfügbar

 

Literatur

Empfohlene Literatur
Keine empfohlene Literatur angegeben

Zugeordnete Studiengänge


Diese Modulversion wird in folgenden Studiengängen verwendet:

Studiengang / StuPOStuPOsVerwendungenErste VerwendungLetzte Verwendung
Dieses Modul findet in keinem Studiengang Verwendung.

Sonstiges

Keine Angabe