Anonymisierte Daten aus Mobilfunknetzwerken

Die amtliche Statistik untersucht in nationalen und internationalen Machbarkeitsuntersuchungen den Einsatz von anonymisierten Daten aus Mobilfunknetzwerken. Diese können beispielsweise in den Bereichen Bevölkerung, Verkehr und Tourismus zum Einsatz kommen.

Lesedauer:8 Minuten

Projektziel

Das Hessische Statistische Landesamt (HSL) untersucht die Eignung anonymisierter Daten aus Mobilfunknetzwerken in der Beherbergungsstatistik. Hierzu wurden von einem Mobilfunkbetreiber monatlich zusammengefasste Daten für verschiedene Kategorien gebildet, die für die Beherbergungsstatistik relevant sind (Gästeankünfte, Gästeübernachtungen). Das HSL vergleicht diese mit den Ergebnissen der Beherbergungsstatistik. Darüber hinaus soll die Abbildung des Tages- und Geschäftstourismus untersucht werden.

Datengrundlage

Bei aktiver Nutzung einzelner Dienste (Telefonieren, SMS, mobiles Internet) und bei nicht-aktiver Nutzung fallen Daten im Mobilfunknetzwerk an. Durch die grundsätzlich hohe räumliche Mobilfunkabdeckung, der technischen Notwendigkeit des regelmäßigen Kontakts zwischen Sender und Empfänger (zum Beispiel einem Mobiltelefon und einem Sendemast), sowie der weiten Verbreitung von Mobilfunknutzung in der Bevölkerung, liegen solche Prozessdaten sowohl vollständig als auch räumlich und zeitlich fein gegliedert vor. Nach Anonymisierung und Aufbereitung der Daten können sie genutzt werden.

Methodik/Vorgehensweise

Bestimmte Signale in einem Mobilfunknetzwerk werden innerhalb eines Gebiets und innerhalb eines Zeitraums ermittelt. So wird beispielsweise aufgezeichnet, wie viele unterschiedliche SIM-Karten sich in einer aus mehreren Mobilfunkzellen zusammengefassten „Verkehrszelle“ befanden. Diese Daten und Verkehrszellen lassen sich mit anderen Daten verknüpfen, zum Beispiel mit der amtlichen Einwohnerzahl oder öffentlich zugänglichen Internetdaten.

Ergebnisse

Durchschnittlicher Anteil an Tagestouristinnen und -touristen sowie Pendlerinnen und Pendlern in Hessen nach Wochentagen und Monaten

Die durchschnittlichen Tagessummen im Beobachtungszeitraum zeigen einen deutlichen Wochenrhythmus auf – sowohl für den Pendlerverkehr als auch für den Tagestourismus: Während an den Wochentagen beide Gruppen höhere Anteile verzeichnen, ist am Wochenende – vor allem sonntags –  der Anteil an Pendlerinnen und Pendlern erheblich geringer. Es ist deutlich erkennbar, dass sich die Muster beider Gruppen insgesamt sehr ähneln. Ein größerer Unterschied lässt sich dennoch feststellen: Der Rückgang des Tagestourismus am Wochenende bzw. am Sonntag ist nicht so stark ausgeprägt wie beim Pendlerverkehr.

Durchschnittlicher Anteil an Tagestouristinnen und -touristen sowie Pendlerinnen und Pendlern in Hessen nach Wochentagen und Monaten
Vervielfältigung und Verbreitung, auch auszugsweise, mit Quellenangabe gestattet.
Bild in Originalgröße herunterladen

Durchschnittliche Anzahl an Tagestouristinnen und -touristen sowie Pendlerinnen und Pendlern in Hessen nach Uhrzeit in den Monaten Juli 2019 bis März 2020 (in % des Gesamtmittelwerts)

Betrachtet man die durchschnittliche Anzahl an Pendlerinnen und Pendlern sowie Tagestouristinnen und -touristen pro Stunde und Monat, so ist – wie beim Wochenrhythmus – ein stabiles Muster erkennbar: Beide weisen einen unterdurchschnittlichen Anteil frühmorgens und nachts sowie einen stark steigenden Anteil morgens und abends auf. Zudem ist deutlich zu erkennen, dass der Tagestourismus zu einem späteren Zeitpunkt am Tag einsetzt als der Pendlerverkehr. Auch in den späteren Abendstunden liegt der Anteil der Tagestouristinnen und -touristen über dem der Pendlerinnen und Pendler.

Durchschnittliche Anzahl an Tagestouristinnen und -touristen sowie Pendlerinnen und Pendlern in Hessen nach Uhrzeit in den Monaten Juli 2019 bis März 2020 in Prozent des Gesamtmittelwertes
Vervielfältigung und Verbreitung, auch auszugsweise, mit Quellenangabe gestattet.
Bild in Originalgröße herunterladen

Durchschnittliche Anzahl an Pendlerinnen und Pendlern (erfasst über Mobilfunk), durchschnittliche Tagessumme im Zeitraum Juli 2019 bis März 2020) als Anteil an sozialversicherungspflichtig beschäftigten Pendlerinnen und Pendlern (am Arbeitsort, Stichtag 30.06.2019) in hessischen Städten und Gemeinden

Lesehilfe zur folgenden Abbildung:
In der Abbildung werden kalibrierte Daten dargestellt, d.h. hochgerechnete Zahlen. Die Anzahl der gezählten Pendlerinnen und Pendler, die über anonyme Mobilfunkdaten erfasst wurden, wird hier als Anteil an den sozialversicherungspflichtig beschäftigten Pendlerinnen und Pendlern am Stichtag 30.06.2019 dargestellt. Die Zahlen wurden für jede hessische Stadt und Gemeinde und für den Arbeitsort berechnet (siehe rote Kreise). Die Größe des Kreises ist proportional zur Anzahl der einpendelnden sozialversicherungspflichtig Beschäftigten in der entsprechenden Stadt oder Gemeinde. Der Mittelwert über alle hessischen Städte und Gemeinden ist als rote Linie bei 77 Prozent dargestellt. Ein Punkt bei 120 Prozent bedeutet z.B., dass die Zahl der über Mobilfunk erhobenen Pendlerinnen und Pendler in dieser Stadt bzw. Gemeinde um 1,2 Mal höher ist als der Referenzwert der sozialversicherungspflichtig beschäftigten Pendlerinnen und Pendler. Im Durchschnitt beträgt die über Mobilfunkdaten ermittelte Summe für Pendlerinnen und Pendler für alle hessischen Städte und Gemeinden 77 Prozent der Summe der einpendelnden sozialversicherungspflichtig Beschäftigten.

Durchschnittliche Anzahl an Pendlerinnen und Pendlern als Anteil an sozialversicherungspflichtig beschäftigten Pendlerinnen und Pendlern in hessischen Städten und Gemeinden
Vervielfältigung und Verbreitung, auch auszugsweise, mit Quellenangabe gestattet.
Bild in Originalgröße herunterladen

Erstes Fazit der Ergebnisse aus anonymen Mobilfunkdaten

Diese ersten Ergebnisse verdeutlichen das große Potential von anonymen Daten aus Mobilfunknetzwerken: Im Vergleich zur amtlichen Statistik liefern sie eine höhere zeitliche Auflösung (durchschnittliche Summen pro Tag, Wochentag und Stunde anstatt lediglich Monatssummen) von Pendlerinnen und Pendlern und erlauben erstmals eine umfassende Abbildung des Tagestourismus.

Der erste Abgleich der Mobilfunkdaten mit den Gästeankünften und Übernachtungen aus der Beherbergungsstatistik führt zu keinen plausiblen Übereinstimmungen bzgl. Muster und Verläufen. Das heißt aber nicht, dass Mobilfunkdaten zukünftig in der amtlichen Statistik nicht genutzt werden können. Um die Daten nutzbar zu machen, sind zwei Möglichkeiten denkbar:

Im präsentierten Beispiel konnten nur die Daten eines Mobilfunkanbieters untersucht werden. Es wurden v.a. „unkalibrierte“ Daten verwendet, um Effekte durch diese Gewichtung und Hochrechnung auszuschließen und getrennt zu untersuchen. Wenn der amtlichen Statistik der Zugang zu den Daten aller Mobilfunkanbieter ermöglicht wird, ist davon auszugehen, dass plausiblere Ergebnisse erzielt werden. Wenn der Zugriff auf diese Daten nicht möglich ist, können die erzielten Ergebnisse mit einem erweiterten Zugriff auf die notwendigen Kalibrierungs- und Hochrechnungsmodelle optimiert werden.

Definitionen bzw. Erläuterungen

Pendlerinnen und Pendler befinden sich morgens und abends am selben Ort, und dazwischen (mindestens zwei Stunden) an (mindestens) einem anderen Ort. Pendlergeschehen findet in der Regel morgens (hier in dieser Untersuchung vor 9 Uhr) und nachmittags bis abends statt (z.B. der Weg zu und von der Arbeit oder Ausbildungsstätte).

Tagestourismus: Im Gegensatz zu den Pendlerinnen und Pendlern kehren (Tages-)Touristinnen und Touristen abends nicht zwangsläufig an den Ort zurück, an dem sie den Tag begonnen haben. Zudem ist für die touristische Mobilität kein Aufenthalt bereits vor 9 Uhr an einem anderen Ort notwendig: Zum Tagestourismus zählen demnach Ausflüge und Besuche von Freunden und Familie unter der Woche oder am Wochenende. Ein Museums- oder Schwimmbadbesuch sowie längere Einkäufe in der Nachbarstadt fallen ebenfalls in die Kategorie Tagestourismus.

Schlagworte zum Thema