Ermitteln von Schlafgelegenheiten von Beherbergungsbetrieben des HRS-Portals

Für ein Methodenprojekt wurde die Bettenanzahl von Beherbergungsbetrieben im Raum München benötigt und als Quelle für die Unternehmensidentifikation das im Internet öffentlich zugängliche Portal „hrs.de“ gewählt.

Auf dem HRS-Portal sind folgende auslesbare und frei zugängliche Informationen abrufbar:

Anzahl Einzelzimmer, Anzahl Doppelzimmer, Anzahl Zimmer allgemein, Name, Anschrift (Straße, Hausnummer, Postleitzahl), Geokoordinaten (Längengrad, Breitengrad), Hotelkategorie (Anzahl Sterne), Hotelart und das Rating.

Die Struktur der jeweiligen Sekundärwebseiten mit den Informationen über den entsprechenden Beherbergungsbetrieb folgt einem ähnlichen Muster wie die unter der Google-Suchmaschine enthaltenen Webseiten.

Ähnlich dem Verfahren, welches den Google-Resultaten folgt, werden hier die Quelltexte hierarchisch analysiert, bis die Ergebnisquelltexte/Hotelseitenquelltexte gefunden wurden. In diesen wird kontextabhängig mit Methoden des Text-Minings nach den Ausprägungen der jeweiligen Merkmale gesucht, um diese strukturiert zu speichern.

Auf diese Weise konnten alle Münchener Beherbergungsbetriebe am Stichtag 6. Juli 2018, die über das HRS-Portal gelistet wurden, ausgelesen und die enthaltenen Daten über das jeweilige Bettenangebot gespeichert werden. Der Datensatz enthält statistisch quantifizierbare Informationen (Ausprägungen) aller oben beschriebenen Merkmale.

Im HRS-Portal wurden am 6. Juli 2018 37 562 Betten in München angeboten. 54,0 % davon entfielen auf Doppelzimmer. 25,0 % des Bettenangebots entfiel auf Einzelzimmer und 21,0 % auf andere nicht definierte Angebotsvarianten.

Darüber hinaus waren noch weitere statistisch auswertbare Mikrodateninformationen auf dem Onlineportal enthalten. So waren u. a. die Hotelkategorie, und der Hoteltyp verfügbar. Die Abbildung zeigt daher die Verteilung der 37 562 Schlafgelegenheiten im Raum München auf die erwähnten Merkmale.

Die Ergebnisse zeigen, dass Wellness und City-Hotels in München am meisten vertreten sind. Dabei sinkt die relative Bedeutung der City-Hotels mit steigender Hotelkategorie (Bewertung nach Sternen). Bei Wellness-Hotels ist der Zusammenhang umgekehrt. Diese sind erst ab drei Sternen beobachtbar und nehmen in der Auftrittshäufigkeit von 70,5 % den größten Anteil der Münchener 5 Sternehotels im HRS-Portal ein.

Luxushotels sind mit ca. 14,6 % Anteil an den Schlafgelegenheiten ausschließlich im obersten Sternebereich zu finden. Business Hotels dominieren mit 48,9 % der angebotenen Schlafgelegenheiten in der mittleren Hotelkategorie mit 3 Sternen. Hotels ohne Angabe bzgl. Hoteltyp sind am meisten in der Hotelkategorie 1 Stern mit etwa 80,8 % Anteil zu finden.

Verteilung der Schlafgelegenheiten des HRS-Portals im Raum München auf Hotelkategorie in Sternen und Hoteltyp
Webscraping

Die Eigenschaft City-Hotel ist mit etwa 63,2 % am häufigsten bei Hotels beobachtbar, die nicht am internationalen Verfahren zur Hotelkategorisierung teilnehmen.

Das Webscraping von Online-Portalen zeigt, dass es sehr gut geeignet ist, umfassende Informationen über Unternehmen einer bestimmten Branche elektronisch zu erheben, ohne die amtlichen Register dafür benutzen zu müssen.

Es zeigt auch, dass das Ermitteln von Unternehmenseigenschaften, wie die in diesem Fall interessierende Anzahl der Betten in Abhängigkeit von der Verfügbarkeit, relativ einfach und treffsicher elektronisch erhoben werden könnten.

Zum Inhaltsverzeichnis                          zurück                          weiter