Sind Sie sich sicher?
Die zunehmende Digitalisierung der Gesellschaft führt dazu, dass immer mehr, immer voraussetzungsreichere und zunehmend komplexere Entscheidungsprozesse an Computerprogramme delegiert werden. Computerprogramme bestehen aus Algorithmen, also aus Verfahrensvorschriften, die dem Computer sein Verhalten vorgeben. Diese Algorithmen werden von Menschen programmiert. Man könnte deshalb argumentieren, dass die Delegation von Entscheidungsprozessen an Computerprogramme kein grundsätzliches Problem darstellt, weil Computer letztlich nur Befehle ausführen, die Menschjen ihnen einprogrammiert haben. So einfach ist es jedoch nicht. Zum einen sind viele der Softwareprogramme, auf deren Entscheidungen wir uns im täglichen Leben verlassen, kommerzielle Produkte, und ihre Hersteller behandeln die in ihnen implementierten Entscheidungslogiken als Betriebsgeheimnisse. Zum anderen werden die Softwareprogramme zunehmend lernfähig. Das gilt insbesondere für die so genannten prädiktiven Systeme, die aus einem beobachteten Verhalten Muster ableiten, die dann verwendet werden, um Voraussagen über wahrscheinliches zukünftiges Verhalten zu treffen. Solche Algorithmen werden zunehmend in Bereichen eingesetzt, in denen Daten über das Verhalten menschlicher Akteure die Grundlage der Vorhersagen bilden. Im Alltag bereits weit verbreitet sind prädiktive Systeme, die aus den Daten von Kunden Vorhersagen über deren Konsumverhalten und künftige Vorlieben ableiten und dieses prädiktive Wissen beispielsweise für personalisierte Werbung einsetzen. In den USA nutzen Richter und Bewährungshelfer prädiktive Systeme, um die Rückfallwahrscheinlichkeit von Straftätern abzuschätzen. Auch bei der Personalauswahl in Einstellungsverfahren kommen solche Systeme bereits breit zum Einsatz. Der zunehmende Einfluss algorithmischer Entscheidungsprozesse in allen Sphären des gesellschaftlichen Lebens wirft eine Vielzahl soziologischer Fragen auf: Wie verändert sich das Verhältnis von Privatheit und Öffentlichkeit, wenn sich aus den Datenspuren, die Akteure in ihrem alltäglichen Leben hinterlassen, personenbezogenes Wissen über Verhaltensdispositionen verschiedenster Art ableiten lassen? Welche Gefahren der Manipulierbarkeit ergeben sich aus diesem prädiktiven Wissen? In welchem Umfang wirken prädiktive Systeme diskriminierend, etwa wenn vorurteilsbehaftete Verhaltenseinschätzungen in die automatisierte Musterbildung einfließen oder bei der Musterbildung Verhaltenseigenschaften mit gruppenbezogenen Personenmerkmalen verknüpft werden, um so personengruppenspezifische Vorhersagen treffen zu können? Gegenstand des Seminars ist es, diese und andere Fragen anhand aktueller Forschungsliteratur zu diskutieren.
„Big Data“ (auch: Massendaten, soziale Buchführungsdaten, standardisierte prozessproduzierte Daten) sind derzeit in aller Munde, und der aktuelle öffentliche und politische Diskurs suggeriert, dass es sich um ein vollkommen neues Phänomen handelt. Dabei wird vergessen, dass es sich bei Massendaten um eine der ältesten Datenquellen historischer und sozialwissenschaftlicher Forschung handelt und dass Deutschland nicht nur aufgrund seiner langen Geschichte einer modernen Staatsbürokratie einen besonders reichhaltigen Fundus von Massenakten aufweist, sondern dass es eine entsprechend lange Methodentradition gibt. Heute sind Massendaten insbesondere in der Technik-, Organisations- und Raumsoziologie eine wichtige Datenquelle. Um was für Daten genau handelt es sich, und wie geht man mit diesen Daten um?
Die Studierenden erwerben Kenntnisse der besonderen methodologischen Herausforderungen von Big Data im Vergleich zu anderen Datensorten sowie des Umgangs mit diesen Daten.
Hierzu nimmt das Modul eine doppelte Unterscheidung vor:
1. Prozessproduzierte vs. forschungsinduzierte Daten: Auch wenn Massendaten in vielerlei Hinsicht Umfragedaten ähneln, werfen sie doch spezifische methodologische Probleme auf, da der Forscher den Datenproduktionsprozess methodisch nicht kontrollieren kann. Vielmehr beeinflussen soziale und institutionelle Filter, welche Daten wie produziert werden und welche Daten wie aufbewahrt werden.
2. Klassische und moderne Varianten von Massendaten: Klassisch werden administrative Daten, die als Nebenprodukt von organisationalen und behördlichen Prozessen entstehen (z.B. Registerdaten, Kundendaten), nicht nur seit den 1970er Jahren digital gespeichert und verarbeitet, sondern seit Ende der 1990er Jahre etwa über Forschungsdatenzentren und den RatSWD zunehmend für wissenschaftliche Analysen zugänglich gemacht. In jüngerer Zeit entstehen außerdem als Nebenprodukt der digitalen Kommunikation im Web 2.0 neue Arten von Massendaten (z.B. Websites, Blogs, Social Media), die – anders als frühere prozessproduzierte Daten – von den Nutzern dieser Dienste unbewusst und/oder freiwillig generiert werden, bei denen sich die Geschwindigkeit der Datenproduktion stark erhöht hat und die Rechte an den Daten nicht mehr bei staatlichen Akteuren, sondern bei Firmen liegen oder uneindeutig sind.