Wie in unserem Leitfaden erklärt, spielen Metadaten u.a. eine wichtige Rolle bei der Nutzbarkeit und Auffindbarkeit von offenen Daten. Im Falle der Auffindbarkeit, sind die sogenannten Tags (auch als Schlüsselwörter bekannt) besonders kritisch.
Ein Tag ist ein Wort oder ein Begriff, der einen Datensatz beschreibt. Ein Tag kann die thematischen Inhalte eines Datensatzes beschreiben („Fahrrad“ oder „Krankenhaus“) oder auch den Kontext rund um den Datensatz (z.B. den Zusammenhang zwischen dem Datensatz und einem bestimmten Gesetz oder Ereignis).
Tags helfen Nutzer:innen dabei relevante Datensätze zu finden. So könnte eine interessierte Person zum Beispiel für ein Projekt Daten zur Radverkehrsinfrastruktur im Datenportal suchen, weiß aber nicht, welche offenen Daten dazu überhaupt existieren, geschweige denn welchen Titel die relevanten Datensätze tragen. Der Begriff „Radverkehrsinfrastruktur“ ist sehr spezifisch und bei seiner Suche im Open Data Portal ohne Ergebnisse, was nicht überraschend ist. Gesucht wird daher meist mit allgemeiner formulierten Begriffen, in diesem Fall z.B. mit „Fahrrad“, um möglichst viele Datensätze mit einer Relevanz zum Thema Radverkehr, oder auch eben nur den einen Gewünschten zu finden. Mit der Suche nach „Fahrrad“ wird einem u.a. direkt der Geodatensatz „Radverkehrsanlagen“ angezeigt, für den das Wort „Fahrrad“ als Schlüsselwort in den Metadaten hinterlegt ist.
Tags können für Nutzer:innen ebenfalls nützlich sein, um zusammenhängende Datensätze zu finden. So könnte eine Person z.B. den Datensatz „Entwicklung Luftqualität – Emissionen 2015“ gefunden haben. Sie will nun wissen, ob es weitere Datensätze zum Thema Luftqualität in der Stadt gibt. Statt über die Suchfunktion des Portals nun verschiedene Begriffe rund um Luftqualität einzugeben, kann sie auch einfach die hinterlegten Tags für den Datensatz anschauen und direkt auf „Luftqualität“ klicken. Daraufhin werden alle Datensätze angezeigt, die diesen Tag ebenfalls nutzen.
Betrachtet man die Gesamtheit der Tags im Berliner Datenportal, kann man außerdem ein paar Rückschlüsse über den Stand von Open Data in Berlin ziehen. Es gibt verschiedene Möglichkeiten, die Tags des Portals zu analysieren. Eine davon ist zu schauen, welche Tags oft in Zusammenhang miteinander benutzt werden, um Themencluster aus dem Datenportal zu erkennen. Wir haben eine Netzwerkanalyse von häufigen Tags im Berliner Datenportal durchgeführt und die Ergebnisse in einem interaktiven Graphen visualisiert.
Natürlich ist das Potenzial von Tags, die Nutzer:innen zu ihren gewünschten Datensätzen zu führen, komplett davon abhängig, wie effektiv die angegeben Tags wirklich sind. Hier spielen die Datenbereitsteller:innen eine kritische Rolle, denn sie bestimmen die Tags. Um das Potenzial von Tags richtig auszunutzen, empfehlen wir für jeden Datensatz mindestens 5 Tags anzulegen (aber gerne mehr!). Und falls Sie sich fragen, wie man besonders effektive Tags auswählt, hier ein paar Tipps: