
Aktuelle Datenperle – Fahrraddiebstähle
5-6 Minuten
Für diese Ausgabe der Datenperle hat Odi – unser Informant für Open Data - den Kerndatensatz aus dem Berliner Open-Data-Portal zum Thema Fahrraddiebstähle in Berlin unter die Lupe genommen.
In dieser Datenperle beauftragen wir ODI – unser Informant für Open Data – genauer nachzusehen, wo es im Berliner Haushalt im Jahr 2023 ungeplant zu Mehrausgaben gekommen ist - und erfahren, was uns diese Informationen über unsere Stadt erzählen.
Alle zwei Jahre legt sich das Land Berlin einen Finanzierungsplan auf, den sogenannten Doppelhaushalt. Dieser regelt, was Land und Bezirke an Ausgaben zur Verfügung steht. Mit unserem interaktiven Tool zu den Berliner Haushaltsdaten haben wir den aktuellen Datensatz zum Doppelhaushalt bereits veranschaulicht und laden zum Explorieren ein.
Trotz gründlicher Planung lassen sich jedoch nicht alle finanziellen Entwicklungen in einer Metropole wie Berlin exakt vorhersehen. Ungeplante Reparaturmaßnahmen, wie der Abriss einer Brücke, aber auch politische Ereignisse aus deren Folge zum Beispiel mehr Menschen nach Berlin kommen, um Schutz zu suchen, können in einem Doppelhaushalt sicher nur schwer geschätzt und eingeplant werden. Wenn plötzlich mehr Steuergeld ausgegeben werden muss, sollten Bürger:innen nachvollziehen können, wohin das Geld fließt – und ob die politischen Prioritäten dabei nicht aus dem Blick geraten.
Deshalb ist es ein wichtiger Schritt, dass das Land Berlin im Berliner Open Data Portal seit Kurzem transparent macht, welche Ausgaben über den Doppelhaushalt hinaus gestemmt werden müssen. Wo bröckelt die Infrastruktur? Mit welchen Krisen ist die Kommune derzeit konfrontiert? Welche Investitionen waren eigentlich gar nicht vorgesehen? All das sind Fragen, bei deren Beantwortung uns der Kerndatensatz „Über- und außerplanmäßige Ausgaben und Verpflichtungsermächtigungen Berlin 2023“ weiterhelfen kann.
Bevor wir jedoch genauer in den Datensatz schauen, ist eine kleine Einführung in die Begrifflichkeiten der Haushaltsplanung notwendig.
Nun können wir aber wirklich starten und uns einige spannende Posten aus dem Datensatz ansehen.
Mal sehen, wie viele Brückensanierungen wir finden…
Insgesamt hat das Land Berlin im Jahr 2023
2.229.408.218,20 € mehr ausgegeben, als geplant, wenn wir überplanmäßige, außerplanmäßigen Ausgaben sowie die Verpflichtungsermächtigungen zusammenrechnen. Schauen wir zunächst auf die größten außerplanmäßigen Ausgaben im Jahr 2023: Auffällig ist, dass viele dieser Ausgaben im Bereich Bau und Infrastruktur anfallen. Einige dieser Posten sind eher allgemein gehalten und wenig aussagekräftig, wie der „Kommunale Anteil an Infrastrukturmaßnahmen im Rahmen der Europäischen Förderung“. Andere beschreiben hingegen konkrete Bauvorhaben, zum Beispiel „09G06, Melli-Beese-Schule: Erweiterungsbau, Komplettsanierung Bestand, Sanierung Schul- u. Freiflächen, Errichtung Interimsstandort als ZF und AF; 12487, Engelhardstraße 18“.
Auch politische Ereignisse schlagen sich in den Daten nieder. Die größten Mehrkosten entstanden durch die „Heimerziehung für alleinstehende minderjährige Asylbewerberinnen und Asylbewerber nach dem Kinder-und Jugendhilfegesetz“ Das zeigt: Auch gesellschaftliche und geopolitische Entwicklungen finden ihren Ausdruck in Haushaltszahlen. Unvorhergesehene Ereignisse wie der Krieg in der Ukraine können nur schwer in Haushaltskalkulationen berücksichtigt werden.
Ebenfalls ins Auge fallen die Ausgaben im Zusammenhang mit der Fußball-EM 2024. So ist die Verpflichtungsermächtigung, die für die Berliner Spiele eingeplant ist, über 8,5 Mio. teurer als ursprünglich im Haushalt vorgesehen.
Ihr seht also, dass selbst Haushaltsdaten, die auf den ersten Blick etwas kryptisch und unverständlich erscheinen mögen, eine Exploration verdienen und viel darüber aussagen können, welche Themen, Krisen oder Projekte eine Stadt gerade beschäftigen. Offenheit ist hier zentral: Wo fließen Steuergelder hin? Wo wird umgeplant? Und wo entstehen unerwartete Mehrkosten? Klickt euch gerne selbst durch den Datensatz.
Na, ist euch was aufgefallen? Gleich drei Einträge in den Daten betreffen das Thema Brücken.
Um weitere Erkenntnisse aus den Daten ziehen zu können, würde es helfen, die Posten in die Berliner Haushaltskategorien einzuteilen, die in diesem Datensatz nicht vorhanden sind. Dafür nutzen wir das KI-Tool ChatGPT, laden die Daten hoch und stellen die Kategorien aus dem Datensatz Berliner Haushaltsdaten zur Verfügung.
Der Algorithmus der KI ordnet anschließend die einzelnen Posten den Kategorien zu und fragt nach unserer Einschätzung.
Hier bekommt ihr einen Einblick in den Ablauf der Kategorisierung:
Im Ergebnis präsentierte uns ChatGPT einen überarbeiteten, neuen Datensatz, der die einzelnen Posten bestmöglich einer Kategorie der Berliner Haushaltsdaten zuordnet.
Beim Durchsehen fällt auf, dass nicht alle Zuordnungen perfekt sind – dennoch ergibt sich ein hilfreicher erster Überblick. Das Experiment macht deutlich, wie KI-Tools bei der Datenanalyse unterstützen können.
Eine visuelle Zuordnung der Kategorien seht ihr hier:
Der Datensatz ist Teil der Berliner Kerndatensätze. Er zeigt verschiedene Haushaltsposten und deren jeweiligen Bereich, Kapitel (zugeordnete organisatorische Einheit) und Titel (spezifische Positionen innerhalb des Kapitels).
Dazu ist jeweils die Höhe der Ausgaben in der entsprechenden Spalte für überplanmäßige und außerplanmäßige Ausgaben oder Verpflichtungsermächtigungen angegeben. Den kompletten Datensatz könnt ihr euch hier herunterladen.
Zunächst muss der Datensatz bereinigt werden. Beim Import der CSV-Datei in Excel aus dem Datenportal muss deshalb auf den richtigen Dateiursprung geachtet werden, um sicherzustellen, dass beispielsweise Sonderzeichen korrekt angezeigt werden. Außerdem war es notwendig eine zusätzliche Spalte hinzuzufügen, um den Bereich (also den Bezirk bzw. die Landesebene) auch namentlich abzubilden.
Die Schlüsseltabelle wird dafür auch im Datenportal zur Verfügung gestellt. Um Posten miteinander vergleichen zu können, haben wir mit Hilfe von Excel einige Pivot-Tabelle erstellt – etwa um summierte Ausgaben darzustellen.
Die hier präsentierten Datenvisualisierungen haben wir mit dem kostenlosen Online-Tool Datawrapper erstellt. Die Visualisierungen können durch Klick auf “Einbetten” unter den Diagrammen auch per iFrame in andere Seiten integriert werden. Wie sich mit Datawrapper Charts und Tabellen unkompliziert aus eigenen Daten erstellen lassen, erklären wir auch in diesen Videotutorials.
5-6 Minuten
Für diese Ausgabe der Datenperle hat Odi – unser Informant für Open Data - den Kerndatensatz aus dem Berliner Open-Data-Portal zum Thema Fahrraddiebstähle in Berlin unter die Lupe genommen.
5-6 Minuten
Für die neuesten Ausgabe der Datenperle hat Odi – unser Informant für Open Data - bei der Veröffentlichung eines Datenschatzes aus der Forschung zur Stadtentwicklung unterstützt. Es geht um Dark Stores von Lebensmittellieferdiensten.
8-9 Minuten
Odi – unser Informant für Open Data - stellt anhand von Datenvisualisierungen neue Datenschätze aus dem Berliner Open Data Portal vor. In dieser ersten Ausgabe entdecken wir den neu geöffneten Kerndatensatz zum Glasfaserausbau an Berliner Schulen.
4-5 Minuten
Zum ersten Mal hat die ODIS in der Verwaltungsakademie Berlin eine Schulung zum Thema "Visualisierungen mit Datawrapper" angeboten. Wir berichten im Blogpost.