Webscraping...
...von Unternehmenswebseiten und maschinelles Lernen zum Gewinnen von neuen digitalen Daten
Neue digitale Daten aus dem Internet
Webscraping – Hintergrund
- Daten Suchen, Finden, Strukturieren, Speichern
- Webscraping auf europäischer und internationaler Ebene
- Webscraping im Hessischen Statistischen Landesamt
Funktionsweise
- Suchen, Finden und Verknüpfen
- Scraping von Unternehmenswebseiten mittels Metasuchmaschine
- Scraping von kommerziellen Onlineportalen
Datenanreicherung
- Datenanreicherung mit verknüpften Inhalten
- Direkte Datenanreicherung
- Indirekte Datengewinnung – Maschinelles Ermitteln von Unternehmenseigenschaften
Anwendung auf Amtliche Daten
- Technische Umsetzung
- Stammdaten aus dem amtlichen Unternehmensbestand
- Ergebnisse der Verknüpfungen
- Maschinelle Bestimmung der latenten Unternehmenseigenschaft „E-Commerce“
- Ermitteln von Schlafgelegenheiten von Beherbergungsbetrieben des HRS-Portals
Fazit und Verbesserungspotenzial
Literaturverzeichnis
Kompletter Artikel im PDF-Format
Web scraping from company websites and online portals - english version in PDF format