Vorteile durch das Gewinnen von Internetdaten

Durch das automatisierte Gewinnen der neuen digitalen Daten kann die Amtliche Statistik auf verschiedene Weisen verbessert werden:

  • Erhebungsunterstützung: Statistische Informationen, die aktuell noch per Befragung, Interview oder Umfragen aufwändig erhoben werden müssen, sind bereits im Internet vorhanden und könnten zukünftig durch Webscraping automatisch und regelmäßig gewonnen werden. Routinearbeiten und manuelle Recherchen würden entfallen. Dies würde den Erhebungsaufwand deutlich reduzieren. Beispiele hierfür sind die Preisermittlung im Rahmen des Verbraucherpreisindexes, die Ermittlung des Bettenangebotes von Beherbergungsbetrieben oder die E-Commerce-Aktivitäten hessischer Handelsunternehmen.
  • Bestandspflegeunterstützung: Da das Webscraping statistisch quantifizierbare Informationen über Unternehmen liefert, ließen sich diese zur Plausibilisierung verwenden.
  • Schnelligkeit der Datenbereitstellung und Aktualität: Je nach technischer Kapazität könnte das Webscraping Daten in monatlichen Zyklen liefern.  
  • Merkmalskranzerweiterung: Neben der Unterstützung von Erhebungsverfahren könnte das Webscraping statistisch auswertbare Informationen liefern, die noch nicht in der Amtlichen Statistik vorhanden sind. Dazu gehören zum Beispiel die Beteiligung von Unternehmen an E-Commerce-Aktivitäten, Investitionsaktivitäten in nachhaltige Technologie, Sicherheitsstandards auf Unternehmenswebseiten oder die Barrierefreiheit auf Internetshoppingseiten.
  • Entlastung von Auskunftspflichtigen: Öffentlich zugängliche Daten müssten von den Auskunftspflichtigen nicht im Rahmen der Berichtspflicht an die Amtliche Statistik gemeldet werden. Eine Entlastung der Auskunftspflichtigen wäre möglich.

Zusammenfassend lässt sich vom automatisierten Extrahieren digitaler Daten aus dem Internet erwarten, dass die Produkte der Amtlichen Statistik in kürzerer Zeit, zu geringeren Kosten, mit geringerem Befragungsaufwand, mit detaillierterer Aufgliederung und umfänglicher inhaltlicher Diversität verfügbar gemacht werden könnten. Ein vollständiges Ersetzen des herkömmlichen Statistikherstellungsprozesses ist nach den bisherigen Erfahrungen in naher Zukunft nicht zu erwarten, sondern eher eine umfangreiche Ergänzung der bisherigen Prozeduren (siehe Hackl, 2016).

Zum Inhaltsverzeichnis                          zurück                          weiter