Open Data Supertrumpf – The Making Of
Tauche ein in die Entstehungsgeschichte des Kartenspiels Open Data Supertrumpf und erfahre, wie aus offenen Daten ein spielerischer Einblick in Berlins Prognoseräume wurde.
Einleitung
Wie funktioniert eigentlich “Berlin”? Was passiert hinter den Kulissen und beeinflusst unser alltägliches Zusammenleben, die Lebensqualität, das Zusammenspiel von bebauter und natürlicher Umwelt? Birgt die städtische Umgebung auch Risiken und Nebenwirkungen? Gibt es unentdeckte Potentiale? Und wie spiegelt sich die Geschichte einer Stadt in ihrem heutigen Erscheinungsbild wider? Wer durch die Stadt spaziert, kann vieles entdecken. Hinter den sichtbaren Eindrücken verbergen sich jedoch oft unsichtbare Geschichten. Offene Daten können dabei helfen, städtische Phänomene zu entschlüsseln und in einen größeren Zusammenhang zu stellen. Ob es um das Solarpotential auf Dächern geht, die Anfahrtszeit der Rettungsdienste, das kulinarische Angebot, die Straßen oder die Luft - jedes Detail ist Teil des komplexen Gefüges einer Stadt.
Das Kartenspiel Open Data Supertrumpf der Open Data Informationsstelle lädt dazu ein, Berlin spielerisch und weit über das Offensichtliche hinaus mit Hilfe von offenen Daten zu erkunden. Anders als beim klassischen Supertrumpf, bei dem es häufig um Pferdestärken und andere Fahrzeugeigenschaften geht, gibt es beim Open Data Supertrumpf 58 Karten für die 58 Prognoseräume (eine Raumeinheit der Lebensweltlich orientierten Räume LOR) in Berlin. Getrumpft wird in den Kategorien Straßen mit Frauennamen, Solarpotential, Luftqualität, Versiegelung, Schnellimbiss-Anzahl und Rettungsdienst-Anfahrt. Allgemeine Informationen zu Fläche und Bevölkerunhgszahl (Stand 2024) der Prognoseräume sind ebenfalls der Karte zu entnehmen und können nach Belieben als zusätzliche Kategorien dienen.
Welche Datengrundlage für Open Data Supertrumpf zur Verfügung steht und wie die Daten verarbeitet und visualisiert wurden, erfährst du im Folgenden.
Offene Daten im Einsatz: Berlins Prognoseräume im Fokus
Die im Open Data Supertrumpf verwendeten Daten basieren auf offenen Daten aus verschiedenen Quellen und behandeln folgende Themen:
-
Straßen mit Frauennamen: Der Prozentsatz der Straßen mit Frauennamen, bemessen an der Gesamtzahl der nach Personen benannten Straßen im jeweiligen Prognoseraum, basiert auf offenen Daten von OpenStreetMap und Wikidata. Der Datensatz ist in einem öffentlichen GitHub-Repository verfügbar.
-
Solarpotential auf Dächern: Diese Daten aus dem Energieatlas zeigen, wie viel Solarenergie pro Jahr erzeugt werden könnte, wenn alle geeigneten Dächer (basierend auf Neigung, Verschattung etc.) mit Photovoltaik ausgestattet wären. Der gesamte Energiebedarf der Berliner Haushalte liegt bei ca. 4.000 GWh/a.
-
Luftqualität (NO₂): Der Stickstoffdioxid-Gehalt wird als Durchschnittswert im Jahr 2023 angegeben. Die Daten stammen von der Senatsverwaltung für Mobiltität, Verkehr, Klimaschutz und Umwelt. Der Straßenverkehr ist eine bedeutende NO₂-Quelle. Der zulässige WHO-Grenzwert liegt bei 10 μg/m³.
-
Versiegelungsgrad: Diese Umweltatlas-Daten zeigen, wie stark der Prognoseraum im Durchschnitt im Jahr 2021 durch Straßen und Bebauung versiegelt war. Straßen etwa haben einen hohen Grad nahe 100%, teilversiegelte Flächen wie Pflaster, etwa 50%.
-
Anzahl Schnellimbisse: Die Anzahl der Imbisse pro Kiez basiert auf den offenen Gewerbedaten der IHK Berlin. Sie zeigen, wie viele angemeldete Imbisse es im jeweiligen Prognoseraum gibt und wo sie sich befinden.
-
Anfahrtszeit Rettungsdienst: Diese Daten stammen von der Berliner Feuerwehr und zeigen die durchschnittlichen Anfahrtszeiten im Fall von kritischen Rettungsdiensteinsätzen. Eine Hilfsfrist von max. 10 Min. ist das Ziel.
Besonders anschaulich lassen sich die Daten zu den Straßen mit Frauennamen und die Anzahl der Schnellimbisse auf einer Karte darstellen. Die Liniengeometrien der Straßen mit Frauennamen ermöglichen eine präzise Verortung innerhalb der jeweiligen Prognoseräume. Es wird schnell deutlich, dass vor allem im Zentrum Berlins viele bedeutende Frauen geehrt werden. Im Südwesten Berlins ist der “Kronprinzessinenweg” in Zehlendorf Nord, angrenzend an den Forst Düppel, besonders prägnant auf der Karte zu erkennen. Im Bereich des Grunewalds geht dieser Weg in den “Königsweg” über.
Die Visualisierung der Schnellimbisse basiert auf den Punktgeometrien im Datensatz. Hier zeigt sich, dass das Angebot in den äußeren Bezirken mit zunehmender Entfernung zum S-Bahn-Ring abnimmt und sich besonders viele Schnellimbisse in Neukölln tummeln.
Von Rohdaten zum Raumverständnis
Um die örtlichen Unterschiede in Berlin bezüglich der verschiedenen Kategorien zu verstehen, haben wir uns für die Aggregierung der Werte auf Prognoseraumebene entschieden. Alle Datensätze enthalten raumbezogene Informationen, die Daten sind also georeferenziert. Eine Georeferenzierung bezeichnet die Zuweisung raumbezogener Informationen zu einem Datensatz und ist die Voraussetzung für eine räumliche Datenanalyse. Unter den für das Kartenspiel analysierten offenen Datensätzen gab es einige wenige, die bereits eine Zuordnung der Werte zu einer spezifischen Raumeinheit (z.B. LOR) enthielten. In diesen Fällen konnte eine Datenauswertung nach Prognoseraum durch direkte Aggregierung der Werte erfolgen. Enthielt der offene Datensatz Rauminformationen wie zum Beispiel Koordinaten, aber keine direkte Benennung des Prognoseraums, konnte die räumliche Überschneidung der Koordinaten mit den Geometrien der Prognoseräume untersucht werden. Dies ermöglichte sowohl die Aggregierung der Werte nach Prognoseraum als auch die kartografische Darstellung.
Eine Georeferenzierung bezeichnet die Zuweisung raumbezogener Informationen zu einem Datensatz und ist die Voraussetzung für eine räumliche Datenanalyse.
Der Datensatz zu den Prognoseräumen, der für die Untersuchung der räumlichen Überschneidungen zum Einsatz kam, ist über das Geoportal Berlin als WFS- und WMS-Dienst erhältlich. WFS (Web Feature Service) und WMS (Web Map Service) sind zwei standardisierte Geodienste. Ein WFS-Dienst stellt geografische Daten in Form von Features bereit, die heruntergeladen und weiterverarbeitet werden können. Diese Features enthalten sowohl Attributdaten als auch die zugehörigen Geometrien (z. B. Punkte, Linien oder Polygone), die in der Regel in einer Spalte namens “geometry” gespeichert sind. Im Fall der Prognoseräume handelt es sich um die Umrisspolygone der Prognoseräume. Auch mit Hilfe einer GIS-Software wie etwa QGIS können die Geodaten weiter bearbeitet und exploriert werden.
Die Python-Bibliotheken geopandas und shapely sind im Kontext räumlicher Datenanalyse mit Python besonders erwähnenswert und kamen bei der Datenverarbeitung für das Kartenspiel häufig zum Einsatz. Das gewählte Geodatenformat war GeoJSON.
Die Bearbeitung der offenen Daten für Open Data Supertrumpf folgte meistens dem gleichen Ansatz: Erst wurden die die Datensätze für eine räumliche Analyse vorbereitet, dann wurde die Schnittmenge zwischen den Geodaten aus den offenen Datensätzen und den Prognoseräumen identifiziert und schließlich die Werte nach Prognoseraum aggregiert. Je nach Kategorie wurde die Summe berechnet, der Durchschnitt oder der Prozentanteil. Je nach Datensatz, gab es einzelne Details zu beachten.
- Ein Koordinatenreferenzsystems (CRS) auswählen
Bei der Arbeit mit Geodaten ist das Koordinatenreferenzsystem (CRS) von entscheidender Bedeutung. Ein CRS definiert wie geografische Positionen auf einer Karte dargestellt und interpretiert werden. Um eine korrekte und aussagekräftige Analyse der geografischen Daten sicherzustellen, müssen beide Geodatensätze (hier Prognoseräume und offener Datensatz) im gleichen Koordinatenreferenzssystem vorliegen. Stimmen dieses nicht überein, müssen die Daten eines Datensatzes in das CRS des anderen Datensatzes umgerechnet werden. Die Wahl des geeigneten CRS hängt vom jeweiligen Anwendungsfall ab. Häufig wird das globale geodätische Referenzsystem WGS 84 verwendet, das als Grundlage für viele geografische und projizierte CRS dient. Solche CRS sind durch einen EPSG-Code (European Petroleum Survey Group Code) eindeutig identifizierbar. Sie unterscheiden sich unter anderem darin, dass geografische CRS Koordinaten in Grad (Breiten- und Längengrade) angeben, während projizierte CRS diese in linearen Einheiten wie Metern oder Fuß darstellen. Bei den Datenauswertungen für den Open Data Supertrumpf konnte meist EPSG:4326 verwendet werden. Nur in Fällen, in denen es um eine Flächenberechnung geht, wurde auf ein projiziertes CRS zurückgegriffen.
- Datenschnittmenge identifizieren
Nachdem die Koordinatenreferenzsysteme der Datensätze im Open Data Supertrumpf geprüft und ggf. angeglichen wurden, konnte die Überschneidung der Geometrien des offenen Datensatzes mit denen der Prognoseräume untersucht werden. Es gibt verschiedene Wege, um die Schnittmenge in Python zu identifizieren. Eine Möglichkeit besteht darin, die Methode intersects zu verwenden.
- Werte nach Prognoseraum aggregieren
Die Aggregierung der Werte erfolgte bei fast allen Kategorien im Kartenspiel mit Hilfe einer Funktion. Das Verfahren ermöglichte es, basierend auf der Geometrie eines Prognoseraums, die offenen Daten zu filtern und eine Aggregierung durchzuführen. Die Funktion wurde auf jede Zeile im Geodatensatz der Prognoseräume angewendet. Zum Schluss wurden die aggregierten Werte für jeden Prognoseraum in einem Data Frame gespeichert.
Daten, Karten und Design
Auf den 58 Spielkarten sind, neben der aggregierten Werte zu den sechs Kategorien, die Kartenansichten der einzelnen Prognoseräume abgebildet. Zusätzlich sind die Liniengeometrien der Straßen mit Frauennamen und die Standorte der Schnellimbisse auf den Karten visualisiert. Die 12 verschiedenen Farben der Prognoseraumflächen stehen für die 12 Bezirke in Berlin.
Automatisierte Locator-Karten mit Datawrapper-API
Die auf den Spielkarten präsentierten Kartenansichten zu den Prognoseräumen haben wir mit dem kostenlosen Online-Tool Datawrapper und der Datawrapper-API erstellt. Die Verwendung der API-Schnittstelle erlaubte das Vordefinieren der Einstellungen und das Erstellen der 58 Locator-Karten auf einen Schlag. Um Flächen-, Linien- oder Punktgeometrien als Marker in eine Locator-Karte in Datawrapper einbinden zu können, müssen die Geodaten zunächst als GeoJSON-Datei mit CRS = EPSG:4326 vorliegen. Zudem sollten die Dateien insgesamt nicht größer als 2MB sein und die Anzahl der Punktmarker ist auf max. 100 limitiert (weitere Informationen). Da es bei den Standorten der Schnellimbisse mehr als 100 Punktgeometrien gab, haben wir uns hier mit einem Workaround beholfen und die Punkte in Flächen umgewandelt. Zur Nutzung der API muss zunächst ein API-Token auf der Datawrapper-Webseite als Authentifizierungsschlüssel generiert und die Bibliothek Datawrapper im Skript heruntergeladen werden. Ein wichtiger Schritt bei der Erstellung der Karten ist die Definition der Karteneinstellungen sowie der einzubindenden Marker. Nach der Erstellung der Locator-Karten mit den Metadaten in einem Zielordner wurden die Marker als Python-Dictionary-Objekte angelegt und als JSON-Format übergeben.
Zum Nachvollziehen der Datenaufbereitung für das Kartenspiel Open Data Supertrumpf stehen die verarbeiteten Daten und die dazugehörigen Skripte sowie die Datenquellen auf Github zur Verfügung. Solltest du Interesse an einem Kartenspiel zum Beispiel zu Demonstrationszwecken haben, melde dich gerne bei odis@ts.berlin oder schau einfach mal bei ODIS vorbei, vielleicht läuft gerade eine Partie…
Wir wünschen ein gutes Blatt!