Anfang der 2000er entwickelte Tim Berners-Lee das Konzept von Linked Data und ein 5-Sterne-Modell, um Daten maschinenlesbar und besser auswertbar zu machen. Heute ermöglichen Technologien wie Künstliche Intelligenz ganz neue Möglichkeiten, Daten zu analysieren – vorausgesetzt, diese liegen in hoher Qualität vor. In der Berliner Verwaltung ist das jedoch oft nicht der Fall: Daten sind meist nur für Menschen lesbar aufbereitet. Dadurch bleiben viele Potenziale ungenutzt.
Unsere Studie zeigt: Linked Open Data (LOD) kann dieses Potenzial heben, erfordert aber gezielte Anstrengungen und ein technisches und organisatorisches Fundament. In einem über zwei Jahre andauerndem Projekt der Open Data Informationsstelle Berlin haben wir untersucht, wie LOD in der Verwaltung angewendet werden kann. Unser Ziel war es, den Schritt von der Theorie in die Praxis zu machen und Herausforderungen auf dem Weg zum höchsten Reifegrad von Verwaltungsdaten zu identifizieren. Wir wollten außerdem verstehen, welche Anwendungsfälle sich aus LOD ergeben.
”Wenn Daten so bereitgestellt werden, dass Maschinen sie optimal verarbeiten können, entsteht die Grundlage für Anwendungen, die den Menschen tatsächlich dienen – mit größerer Zuverlässigkeit, Transparenz und Zugänglichkeit.
Die vorliegende Studie markiert einen Schritt auf diesem Weg. Ich wünsche eine anregende Lektüre und viele gewinnbringende Erkenntnisse.”
Unser Praxisansatz: Organigramme als Linked Open Data
In der Berliner Verwaltung werden Organigramme bislang dezentral erstellt, meist mit PowerPoint oder Word, und als PDFs auf den Websites der Behörden veröffentlicht. Das bedeutet: Sie sind für Menschen lesbar, für Maschinen jedoch kaum auswertbar. Informationen wie „Wer ist wofür zuständig?“ oder „Welche Abteilung gehört zu welcher Organisationseinheit?“ lassen sich nicht automatisch herauslesen oder weiterverwenden.
Wir haben mit einem eigens entwickelten Organigramm-Tool einen neuen Ansatz getestet: Verwaltungsorganigramme werden dort nicht nur digital erfasst, sondern so aufbereitet, dass sie als 5-Sterne-Linked-Open-Data bereitgestellt werden können. Das bedeutet:
Jede Organisation, Rolle und Person bekommt eine eindeutige URI
Die Daten liegen im RDF-Format vor – als sogenannte Triples (Subjekt-Prädikat-Objekt)
Sie sind verlinkbar mit anderen offenen Datenquellen, z. B. Wikidata
Sie können automatisiert abgefragt und analysiert werden – etwa mit der Abfragesprache SPARQL
In unserer Studie zeigen wir auf, welches Potenzial sich mit Linked Open Data entfalten kann, wenn Wissen miteinander verknüpft wird. So haben wir beispielsweise mit einer SPARQL-Abfrage die Organigramme befragt, welche Positionen in welchen Behörden aktuell vakant sind – eine wertvolle Information im Kontext von Fachkräftemangel und Personalplanung. Noch mehr Potenzial steckt in der Verknüpfung mt weiteren Datenbanken. Hier haben wir mit Wikidata beispielhaft herausgefunden, welche weiteren Informationen zu den Leitungspositionen verschiedener Senatsverwaltungen im Internet auffindbar sind.
Perspektivisch kann sich mit Linked Open Data ein unbegrenzter Wissensgraph bilden.
Schematische Darstellung eines Knowledge Graphs (Wissensgraph). Mit einer Vielzahl an verknüpften Daten entstehen leistungsstarke Wissensnetze.
Bei Organigrammen sollte es nicht bleiben: Was Berlin jetzt tun sollte
Die Studie hat gezeigt: LOD funktioniert – aber es braucht gezielte Maßnahmen, die wir in der Studie herausgearbeitet haben, um das Potenzial zu heben:
Datenkompetenz fördern: Es bedarf in der Verwaltung einer Perspektivänderung dahin, Daten für Maschinen und nicht allein für Menschen lesbar aufzubereiten. Dieser Perspektivwechsel sollte mit Schulungen und Wissensvermittelung gezielt begleitet werden.
Standards etablieren: Gemeinsam mit Behörden wurden im Projekt Vorlagen, Rollenmodelle und Ontologien für Organigramme entwickelt. Für Berlin wäre es sinnvoll, eine zentrale Zuständigkeit zu schaffen, die die Entwicklung von Ontologien für spezifische Anforderungen koordiniert und anstößt und gleichzeitig die Einhaltung internationaler Standards sicherstellt.
Technische Infrastruktur bereitstellen: Prototypen sind wichtig – aber es braucht dauerhafte Triple Stores, offene Schnittstellen und Pflegekonzepte, um LOD nachhaltig in der Verwaltung zu verankern. Der geplante Data Hub im Land Berlin sollte hier perspektivisch die benötigte technische Infrastruktur anbieten.
Verknüpfung statt Einzellösungen: Damit Linked Open Data (LOD) in der Berliner Verwaltung seine volle Wirkung entfalten kann, ist es entscheidend, dass eine Vielzahl relevanter, verknüpfbaren Datensätze zur Verfügung steht.
”Die Linked Open Data-Studie zeigt eindrucksvoll, welches Potenzial in der strukturierten, offenen Bereitstellung von Daten liegt.
Durch die fallbezogene Umsetzung, die ich als Open Data Beauftragter begleiten und unterstützen konnte, und die klaren Handlungsempfehlungen bietet die Studie einen Kompass, um Linked Open Data im Land Berlin zu etablieren.”
Fazit
Unsere Fallstudie zeigt exemplarisch, wie aus alltäglichen Verwaltungsdokumenten echte digitale Wissensressourcen werden können. Damit wird deutlich: LOD bietet eine enorme Chance, Verwaltungsdaten neu zu nutzen und aus den bisherigen Informationssilos ein dynamisches Wissensnetzwerk zu schaffen. Unsere Studie soll dabei ein Wegbegleiter für den Aufbau einer vernetzten, zukunftsorientierten Dateninfrastruktur im Land sein.
In Organigrammen steckt eine Menge Informationen und viele Anwendungspotenziale, wenn es uns gelingt ihre Logiken zu verstehen und einheitliche Standards zu entwickeln. Wir haben versucht den Organigramm-Dschungel zu durchdringen.
Am Beispiel der Organigramme arbeiten wir derzeit an einer praxisnahen Fallstudie, um zu lernen, wie mit wichtigen Basis-Informationen die Grundlage für Linked Open Data in Berlin gelegt werden kann.