Informationen zum Besuch des User-Agents „Mozilla/5.0 (compatible; StatistikHessen, Web Scraping Policy: https://statistik.hessen.de/ua)“ auf Ihrer Seite
Inhalt
- Kontakt bei Fragen / Einschränkungen / Störungen
- Von wo stammt dieser User-Agent?
- Ist dieses Computerprogramm gefährlich für meinen Webserver oder für andere Personen, die meine Seite besuchen/nutzen?
- Was macht das Computerprogramm auf meiner Seite?
- Warum besucht das Computerprogramm ausgerechnet meine Seite?
- „Dürfen die das?“ Kann ich verhindern, dass das Computerprogramm meine Seiten besucht?
- Weitere Informationen
- Kontakt
- Informationen nach Artikel 14 Datenschutz-Grundverordnung (DS-GVO)
Kontakt bei Fragen / Einschränkungen / Störungen
Bitte wenden Sie sich an eine der unter Kontakt genannten Ansprechpersonen, wenn Sie Fragen haben oder Probleme und Störungen Ihres Internetangebots aufgrund des Besuchs des hier beschriebenen User-Agents vermuten. Wir klären umgehend, ob dies von unserem Computerprogramm ausgehen könnte. Falls diese Probleme und Schwierigkeiten von unserem Computerprogramm ausgehen sollten, werden wir dies selbstverständlich umgehend beheben.
Von wo stammt dieser User-Agent?
„Mozilla/5.0 (compatible; StatistikHessen, Web Scraping Policy: https: //statistik.hessen.de/ua)“ ist der sogenannte User-Agent-String eines Computerprogramms des Hessischen Statistischen Landesamtes, das automatisch URLs aufruft, den Quelltext der Seiten abruft, verarbeitet und ggf. speichert.
Dieses Computerprogramm verhält sich dabei im Grunde wie eine Person, die einen Browser benutzt und auf Ihrer Internetseite surft, um dort die Informationen zu lesen oder Dienste zu nutzen, die Sie dort bereitstellen für alle Personen, die die URL zu dieser Seite ebenfalls kennen oder z. B. über eine Suchmaschine gefunden haben.
Ist dieses Computerprogramm gefährlich für meinen Webserver oder für andere Personen, die meine Seite besuchen/nutzen?
Nein. Das Computerprogramm, das diesen Eintrag in Ihren Log-Dateien hinterlässt, stellt keine Gefahr dar, weder für Ihren Webserver noch für andere Nutzende Ihrer Internetseite. Die durch das Computerprogramm verursachte Serverlast unterscheidet sich nicht von einer Nutzung durch eine Person/einen normalen Browser. D.h., dass auch andere Personen in der Nutzung Ihrer Internetseite nicht eingeschränkt werden.
Der Aufruf der Internetseiten über das Computerprogramm findet möglichst zu Zeiten statt, zu denen mutmaßlich eher wenige Zugriffe auf Ihre Seite stattfinden (z. B. vor allem nachts), um Einschränkungen anderer Personen beim Besuch Ihrer Seite von vorneherein zu vermeiden.
Zwischen einzelnen Kontaktversuchen zum Server Ihrer Internetseite werden zudem kurze Pausen eingefügt. Das Computerprogramm verschafft sich keinen Zugang zu Informationen, die jeder anderen Person nicht ebenfalls zugänglich wäre, die die URL der Internetseite kennt. D.h. das Computerprogramm umgeht keinerlei Zugangssperren (z. B. sog. Captchas o.Ä.) und respektiert Vorgaben einer robots.txt, sofern vorhanden und zutreffend.
Was macht das Computerprogramm auf meiner Seite?
Das Computerprogramm besucht Ihre Internetseite wie eine Person, die über einen Browser Ihre Internetseite aufruft. Dabei wird der Quelltext der Internetseite übertragen. Dieser Quelltext wird temporär gespeichert und nach bestimmten Angaben durchsucht und ggf. Angaben auf der Interseite extrahiert. Diese Angaben werden für Auswertungszwecke gespeichert.
Das Computerprogramm analysiert den Quelltext der Internetseite, um zielgerichtet nur die notwendige Information herunterzuladen.
Beim Aufruf Ihrer Internetseite sorgt das Computerprogramm dafür, durch einen eindeutigen User-Agent-String einen Hinweis auf seinen Ursprung, das Hessische Statistische Landesamt, in den Log-Dateien Ihres Servers zu hinterlassen.
Warum besucht das Computerprogramm ausgerechnet meine Seite?
Das Hessische Statistische Landesamt führt verschiedene Tests zur automatisierten Datenerhebung im Internet für Zwecke der Wirtschaftsstatistik durch, verbunden mit den Zielen, Unternehmen und Betriebe, die der amtlichen Statistik Auskunft geben, ggf. in Zukunft zu entlasten oder vorhandene Erhebungen zu ergänzen, ohne dass eine Belastung der Auskunftspflichtigen entsteht. Um zu überprüfen, ob Informationen aus dem Internet geeignete Datenquellen darstellen, führt das Hessische Statistische Landesamt verschiedene technische Tests seiner Software an verschiedenen Internetseiten durch. Automatische Datenerhebung im Internet ist noch nicht im Regelbetrieb der amtlichen Statistik verankert. Dass in Ihren Server-Logdateien der User-Agent-String mit dem Verweis auf das Hessische Statistische Landesamt auftaucht, ist daher im Moment Zufall.
„Dürfen die das?“ Kann ich verhindern, dass das Computerprogramm meine Seiten besucht?
Nach § 5 Abs. 5 Bundesstatistikgesetz (BStatG) dürfen die statistischen Ämter Daten aus „allgemein zugänglichen Quellen“ auch ohne Gesetz oder Rechtsverordnung erheben. Zur Pflege und Führung des Statistikregisters dürfen zudem gemäß § 13 Abs. 2 Satz 4 BStatG Angaben aus allgemein zugänglichen Quellen verwendet werden. Laut § 2 Abs. 2 Nr. 2 des Hessischen Landesstatistikgesetzes (HessLStatG) hat das HSL zudem Statistiken methodisch und technisch vorzubereiten und weiterzuentwickeln.
https://www.gesetze-im-internet.de/bstatg_1987/
http://www.lexsoft.de/cgi-bin/lexsoft/justizportal_nrw.cgi?xid=169522,1
Das Computerprogramm verschafft sich beim Aufruf Ihrer Internetseite keinen Zugang zu Informationen, die jeder anderen Person nicht ebenfalls zugänglich wäre, die die URL der Internetseite kennt. D.h. das Computerprogramm umgeht keinerlei Zugangssperren (z.B. sog. Captchas o. Ä.) und respektiert Vorgaben einer robots.txt-Datei, sofern vorhanden und zutreffend.
Das Computerprogramm des Hessischen Statistischen Landesamtes weist sich mit dem User-Agent-String „Mozilla/5.0 (compatible; StatistikHessen, Web Scraping Policy: https: //statistik.hessen.de/ua)“ aus.
Weitere Informationen
Die amtliche Statistik in Deutschland untersucht verstärkt neue Datenquellen und Wege der Datenerhebung zur Erfüllung ihrer gesetzlichen Aufgaben, um Belastungen für auskunftgebende Personen und Betriebe zu reduzieren. Dazu gehört die Datenerhebung über das Internet aus allgemein zugänglichen Quellen.
Die erhobenen Daten werden solange gespeichert, wie sie für statistische Zwecke benötigt werden. Eine Weitergabe der Daten an Dritte erfolgt nicht. Betroffenen steht ein Recht auf Auskunft zu. Sollten die Daten unrichtig sein, kann unverzüglich Berichtigung verlangt werden. Die Datenschutzaufsichtsbehörde des HSL ist der Hessische Beauftragte für Datenschutz und Informationsfreiheit, an den Sie sich im Beschwerdefall richten können. Kontakt: Hessischer Beauftragter für Datenschutz und Informationsfreiheit, Gustav-Stresemann-Ring 1, 65189 Wiesbaden, Telefon: 0611-14080, https://datenschutz.hessen.de/
Wenn Sie sich näher mit dem Thema „automatisierte Datenerhebung im Internet“ beschäftigen wollen:
- Eine Sonderveröffentlichung des Hessischen Statistischen Landesamtes beschreibt „Webscraping“ ausführlicher:
https://statistik.hessen.de/servicepresse/sonderauswertungen/webscraping - Ein von der Europäischen Kommission initiiertes europaweites Forschungsprojekt, ESSnet Big Data I, hat sich mit neuen Datenquellen für die amtliche Statistik beschäftigt:
https://webgate.ec.europa.eu/fpfis/mwikis/essnetbigdata/index.php/Main_Page1 - Im Rahmen des ESSnet Big DataI ist v.a. das Arbeitspaket 2 „Webscraping Enterprise Characteristics“ von Interesse:
https://webgate.ec.europa.eu/fpfis/mwikis/essnetbigdata/index.php/Category:WP2_Webscraping_enterprise_characteristics1 - Das Forschungsprojekt "ESSnet Big Data I" ist abgeschlossen. Die Europäische Kommission fördert auch das Nachfolgeprojekt ESSnet Big Data II, in dem die Anwendung von Webscraping-Methoden in verschiedenen inhaltlichen Teilprojekten ebenfalls eine wichtige Rolle spielt:
https://webgate.ec.europa.eu/fpfis/mwikis/essnetbigdata/index.php/Main_Page
Kontakt
Bei Fragen wenden Sie sich gerne an das Hessische Statistische Landesamt:
Hessisches Statistisches Landesamt, Wiesbaden
https://www.statistik.hessen.de
Ansprechpersonen sind:
Beauftragte Person für Neue Digitale Daten: Herr Patrik Vollmer
E-Mail: patrik.vollmer@statistik.hessen.de
Beauftragte Person für Datenschutz: Herr Dr. Siniša Begenišić
E-Mail:datenschutzbeauftragter@statistik.hessen.de
Information nach Artikel 14 Datenschutz-Grundverordnung (DS-GVO)
Absatz 1
Verantwortlich: Hessisches Statistisches Landesamt, Rheinstraße 35/37, 65185 Wiesbaden
Kontaktperson: Patrik Vollmer (Beauftragte Person für Neue Digitale Daten)
Telefon: 0611 3802-552
E-Mail: patrik.vollmer@statistik.hessen.de
Beauftragte Person für den Datenschutz: Dr. Sinisa Begenisic
Telefon: 0611 3802-943
E-Mail: datenschutzbeaftragter@statistik.hessen.de
Zweck der Erhebung und Verarbeitung: Vorbereitung und Weiterentwicklung von Statistiken; Nutzung allgemein zugänglicher Datenquellen für statistische Zwecke; §5 Absatz 5 BStatG; §13a Absatz 2 Nr. 4 BStatG; §2 Absatz 2 Nr. 2 HessLStatG.
Erhoben und verarbeitet werden Daten aus allgemein zugänglichen Quellen. Das sind sachliche Verhältnisse von Unternehmen und Betrieben, Anschriften und Kontaktinformationen von Unternehmen und Betrieben.
Eine Weitergabe findet nur an das zuständige Statistische Landesamt statt. Eine Weitergabe an andere Dritte findet nicht statt.
Absatz 2
Die erhobenen Daten werden solange gespeichert, wie sie für statistische Zwecke benötigt werden.
Betroffenen Personen stehen grundsätzlich folgende Rechte zu:
Recht auf Auskunft über die betreffenden personenbezogenen Daten (Art. 15 DS-GVO) sowie auf Berichtigung (Art. 16 DS-GVO) und Löschung (Art. 17 DS-GVO). Ferner besteht grundsätzlich das Recht auf Einschränkung der Verarbeitung (Art. 18 DS-GVO) und auf Widerspruch gegen die Verarbeitung (Art. 21 DS-GVO) sowie ein Recht auf Datenübertragbarkeit (Art. 20 DS-GVO).
Betroffene Personen können sich über die Erhebung und Verarbeitung bei der Aufsichtsbehörde beschweren. Die Aufsichtsbehörde ist der Hessische Beauftragter für Datenschutz und Informationsfreiheit, Gustav-Stresemann-Ring 1, 65189 Wiesbaden, Telefon: 0611-14080, https://datenschutz.hessen.de
Die erhobenen Daten stammen aus öffentlich zugänglichen Quellen (Internetseiten).
Eine Verarbeitung zu einem anderen als dem genannten Zweck ist nicht beabsichtigt.