3.

Daten aufbereiten

Welche Dateiformate kommen in Frage? Was hat es mit der Maschinenlesbarkeit auf sich? Was muss in Sachen Datenschutz beachtet werden?

Illustration für das Modul 3.
Auf dieser Seite

Warum diese Etappe wichtig ist

Um das volle Potential offener Daten auszuschöpfen, ist es entscheidend, dass sie in Strukturen und Formaten vorliegen, die nicht nur für Menschen, sondern vor allem auch für Maschinen lesbar sind. Die Codierung von Informationen – etwa von räumlichen Daten in Geodatenformate – ist ebenfalls wichtig, um die Möglichkeiten für Visualisierungen und digitale Anwendungen zu erweitern. Bei der Aufbereitung von Daten ist zudem die Anonymisierung von Datensätzen mit Personenbezug entscheidend, um Datenschutzanforderungen zu erfüllen. Spezifische Anonymisierungsschritte ermöglichen die Entfernung personenbezogener Informationen, was wiederum die Freigabe von Daten ermöglicht, die sonst nicht veröffentlicht werden könnten.

Wie wir unterstützen

In dieser Etappe geben wir nicht nur einen Überblick über die wichtigsten Kriterien für eine hohe Datenqualität, wir stellen auch konkrete Anleitungen bereit, um Daten so aufzubereiten, dass sie möglichst gut maschinenlesbar und von anderen weiterverwendet werden können. Zusätzlich bieten wir einen Überblick über Methoden im Umgang mit sensiblen Daten, um Informationen unter Wahrung des Datenschutzes zu veröffentlichen.

Das Ziel im Blick – Gründe für Datenaufbereitung

  • Nachnutzung

    Maschinenlesbare Formate erhöhen die Kompatibilität mit verschiedenen Anwendungen. Dies erleichtert die Weiterverwendung und fördert innovative Lösungen.

  • Datenschutz und Sicherheit

    Anonymisierungsprozesse schützen die Identität der Betroffenen und erfüllen Datenschutzanforderungen. Dies stärkt das Vertrauen in die Datennutzung und -verarbeitung.

  • Genauigkeit

    Fehlerkorrekturen während der Datenaufbereitung verbessern die Genauigkeit. Präzise Daten unterstützen valide Analysen und Entscheidungen.

  • Konsistenz

    Einheitliche Datenformate und -strukturen vereinfachen den Datenvergleich und die -integration. Konsistente Daten sind essentiell für langfristige Studien und Vergleiche.

„Damit Daten innovativ genutzt oder verschiedene Datensätze miteinander kombiniert werden können, müssen sie im passenden Format und in guter Qualität vorliegen – oder die Daten entsprechend aufbereitet werden. Die ODIS kann dabei unterstützen.“

Henrik Holst Public Affairs Manager, IHK Berlin Logo von Henrik Holst

Hilfreiche Wegbegleiter

Die Frage der Maschinenlesbarkeit ist vielschichtiger, als es zunächst erscheinen mag. Deshalb haben wir anschauliche Videotutorials erstellt, die alles Wissenswerte zusammenfassen. Wer Daten anonymisieren muss, bekommt mit unserem Handout einen ersten Eindruck über die verfügbaren Möglichkeiten.

4.

Daten veröffentlichen

Die Daten sind nun bereit für den Schritt der eigentlichen Veröffentlichung. In der nächsten Etappe beleuchten wir die verschiedenen Möglichkeiten für die Bereitstellung über das Berliner Datenportal.

Zur nächsten Etappe

Noch Fragen offen?

Fragen oder konkreter Unterstützungsbedarf zu dieser Etappe? Einfach unser Kontaktformular nutzen.