Unternehmensdaten aus dem Internet

2017 waren 72 % der deutschen Unternehmen auf einer Webseite präsent, 46 % waren in den sozialen Medien engagiert und 23 % haben Waren oder Dienstleistungen über das Internet vertrieben (siehe Statistisches Bundesamt, 2017). Viele Unternehmensdaten, die durch Befragungen, Interviews oder manuelle Recherchen aufwendig erhoben, plausibilisiert und gepflegt werden, sind daher bereits im Internet vorhanden und öffentlich zugänglich. Die Notwendigkeit, diese Daten durch die Befragung von Unternehmen zu erheben, könnte durch den Einsatz von Webscraping entfallen.

Neue digitale Unternehmensdaten aus dem Internet sind auf kommerziell genutzten Webseiten enthalten, welche Umsätze durch Waren- und Dienstleistungsverkäufe generieren. Dies trifft bspw. auf elektronische Bestell- und Zahlungssysteme wie Online-Shops, kommerzielle Online-Buchungs-Portale oder auf Onlinedienstleistungsanbieter zu. Darüber hinaus sind Unternehmensinformationen über Online-Präsenzen buchbarer Dienstleistungsanbieter z.B. Handwerker oder auf Webseiten zu Informations- oder Marketingzwecken z.B. Friseurläden verfügbar. In beiden Gruppen, welche den Kern der Internetökonomie darstellen, entstehen die Daten prozessbasiert als Nebenprodukte und sind in der Regel nicht Teil einer beabsichtigten Datenproduktion (siehe Oostrom, Walker, Slootbeek-Van Laar, Azurduy und Rooijakkers, 2016).

Abbildung 1: Neue digitale Daten für die Amtlichen Fachstatistiken aus dem Internet

Webscraping, Statistik, Hessen

Die neuen digitalen Daten können von verschiedenster Art sein und inhaltlich sehr breite Themengebiete abdecken. Hierzu gehören Daten, die für die Verknüpfung mit amtlichen Daten wichtige Entitäten oder Stammdaten wie Name, Adresse oder Steuernummer aber auch wichtige Fachinformationen wie z.B. Preise von Einzelhandelsunternehmen, Anzahl angebotener Schlafgelegenheiten von Beherbergungsbetrieben oder das Vorhandensein von Onlineshops in der Branche des elektronischen Versandhandels enthalten. Einmal gefunden und öffentlich zugänglich, müssen die Neuen digitalen Daten nur elektronisch erfasst und automatisch erhoben werden.

Zum Inhaltsverzeichnis                  weiter