Lehrinhalte
Der Inhalt wird auf Teilen von zwei Büchern basieren: „R for Data Science“ von Hadley Wickham und ‚Geocomputation with R‘ von Robin Lovelace. Das erste Buch beschreibt einen umfassenden Ansatz für die Datenwissenschaft, einschließlich des Ladens, Umwandelns und Visualisierens von Datensätzen mit der Programmiersprache R. Das zweite Buch konzentriert sich auf die Analyse von geografischen Daten, und dieser Kurs wird sich speziell auf Verkehrsdaten in Verbindung mit agentenbasierten Verkehrssimulationen konzentrieren. Es wird ein Projekt in der Mitte des Semesters und ein Abschlussprojekt geben, bei dem die Studenten ihre Ergebnisse präsentieren sollen.
Dies ist kein Kurs über die Programmiersprache R selbst; der Kurs konzentriert sich vielmehr auf die Verwendung von R als Werkzeug für die Datenwissenschaft.
Der Kurs beinhaltet folgende Themen, ist aber nicht darauf beschränkt
- Einführung in R
- Laden von Datensätzen in R
- Visualisierung von Daten
- Datentransformation
- Verbinden von Datensätzen
- Anpassen von Modellen an Daten
- Geografische Daten und Karten
- Analyse von räumlichen Daten und Durchführung geometrischer Operationen
Die Sprache R, die oben genannten Bücher und alle Softwarepakete, die in diesem Kurs verwendet werden, sind frei und Open-Source.